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通常 ， 图 是 由 顶点 集合 和 边 集 合 组 成 的 ， 几 它 表示 的 问题 就 是 所 谓 的 图 论 问题 ， 它 广 
泛 地 出 现在 计算 机 科学 、 信 息 科学 、 人 工 智能 、 网 络 理论 、 系 统 工程 、 运 筹 学 、 控 制 论 、 
物理 学 、 化 学 、 心 理学 、 语 言 学 、 经 济 管理 等 领域 ， 因 而 研究 图 论 问 题 及 其 解法 具有 极其 
重要 的 理论 和 实际 意义 。 

很 多 图 论 问题 表达 容易 ， 但 求解 却 很 困难 ， 常 常 需要 花费 大 量 的 计算 时 间 和 存 贮 空 
hg. 现 已 证 明 相当 多 的 图 论 问 题 是 NP 完全 的 ， 即 当 问 题 的 规模 足够 大 时 ， 往 往 出 现 “ 指 
数 爆 炸 "现象 ， 这 是 传统 的 顺序 计算 机 无 法 求解 的 。 随 着 VLSI 技术 的 发 展 和 并 行 计算 机 
的 出 现 ， 为 人 们 快速 求解 图 论 问题 提供 了 一 条 新 的 途径 . 运用 多 处 理 机 系统 来 求解 图 论 问 
题 ， 在 科学 上 和 工程 应 用 中 发 挥 了 重要 的 作用 。 

形式 地 讲 ， 并 行 算法 是 一 些 可 同时 执行 的 诸 进 程 的 集合 ， 这 些 进程 相互 作用 和 协同 动 
作 ， 从 而 达到 对 给 定 问题 的 求解 。 读 者 将 会 看 到 : 并 行 算法 和 计算 机 结构 密切 相关 ， 不 同 
结构 的 并 行 计算 机 将 会 导致 不 同 风格 的 并 行 算法 . 但是， 本 书 不 可 能 研究 所 有 具体 的 并 行 
计算 机 上 的 并 行 图 论 算法 ， 只 能 从 现 有 的 并 行 计 算 机 中 抽象 出 若 于 典型 的 并 行 计算 模型 
并 围绕 这 些 模型 讨论 各 种 图 论 问 题 的 并 行 算法 。 

本 书 描述 在 多 处 理 机 系统 上 协同 求解 图 论 问题 的 并 行 和 分 布 式 算法 ， 这 些 算法 并 不 完 
全 是 现行 的 顺序 图 论 算法 简单 的 推广 和 扩充 。 事实 上 ， 有 的 图 论 间 题 可 以 从 顺序 算法 转换 
为 相应 计算 模型 上 的 有 效 并 行 算法 ; 有 的 图 论 问题 则 不 然 ， 必 须 从 问题 本 身 出 发 ， 结 合并 
行 计算 模型 ， 研 究 和 设计 新 的 并 行 算法 ， 在 各 种 计算 模型 上 ， 如 何 设计 和 分 析 并 行 图 论 算 
法 ， 是 本 书写 作 的 宗 骨 ， 我 们 将 通过 众多 图 论 问题 并 行 算法 的 讨论 ， 疝 恋 考 介绍 若干 基本 
的 研究 方法 和 技术 。 

最 近 十 余年 来 ， 并 行 处 理应 用 于 图 论 领 域 的 研究 蜡 常 活跃 ， 每 年 都 涌现 出 大 量 的 学 术 
论文 和 研究 报告 在 这 浩如烟海 的 文献 中 ， 摄 取 哪些 材料 作为 本 书 的 基本 内 容 ， 才 能 反映 
这 一 领域 的 最 新 成 果 和 发 展 趋 势 ， 是 我 们 的 努力 方向 ， 作 者 通过 对 计算 机 系 研究 生 ， 高 年 
级 大 学 生 和 青年 教师 讲授 本 书 部 分 内 容 的 教学 实践 ， 以 及 从 事 这 一 领域 研究 工作 的 切身 体 
& REL, BRAT KER. 

本 书 侧重 于 非 数值 计算 方 而 的 内 容 。 全 书 共 分 十 四 章 。 前 两 章 是 并 行 算法 的 基础 ， 包 
括 并 行 计算 机 与 并 行 计算 模型 ;并行 算法 的 度量 与 设计 技术 。 第 三 章 到 第 六 章 集中 介绍 基 
木 图 论 问题 的 并 行 和 分 布 式 算法 。 它 们 是 : 图 的 搜索 ， 求 图 的 连通 分 支 ; 计算 加 权 图 的 域 
小 生成 树 ; 以 及 找 图 的 最 短路 径 等 ， 第 七 章 讨论 并 行 和 矩阵 乘法 及 其 在 图 论 算法 中 的 应 用 。 
第 八 章 到 第 十 二 章 ， 令 述 了 图 论 的 基本 性 质 和 一 些 较 难 的 图 论 问 题 的 并 行 和 分 布 式 算法 。 
内 容 包括 : 无 向 图 的 基本 回路 、 双 连通 分 支 、 关 节点 和 桥 ; RE Ae SPIEL BE; 
AOE 网 和 最 大 流 ; 极 大 独立 集 和 图 的 着 色 等 问题 的 算法 。 第 十 三 章 讨 论 了 用 状态 空间 树 
表示 的 组 合 搜索 问题 的 并 行 算法 ;最 后 一 章 研究 了 神经 网 络 在 图 论 中 的 应 用 ， 每 章 的 结尾 
还 给 旨 了 小 结 和 参考 文献 ， 简 要 概述 了 该 章 的 主要 内 容 ， 列 出 了 有 关 的 最 新 进展 ， 以 便 读 
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者 进一步 研究 时 参考 . 

本 书 前 六 章 和 第 十 三 章 由 唐 策 善 提供 初稿 ， 第 七 章 至 第 十 二 章 由 梁 维 发 提供 初稿 ， 第 
十 四 章 由 唐 锡 南 提供 初稿 ， 最 后 ， 经 唐 策 善 统一 修改 后 定稿 . 

本 书 是 并 行 算法 从 书 之 一 ， 受 国家 863 计划 项 目 资助 。 

我 们 在 撰写 中 ， 曾 直接 或 间接 引用 了 许多 专家 、 学 者 的 文献 ， 陈 国良 教授 对 本 书 的 编 
写 和 出 版 非常 美 心 ， 仔 细 审 阅 了 全 书 内 容 ， 提 出 过 许多 宝 下 意见 ; 唐 锡 南 付出 了 辛勤 的 劳 
动 ， 除 了 提供 第 十 四 章 初 稿 外 ， 对 其 它 章节 亦 提出 了 不 少 有 益 的 建议 ; 唐 锡 杰 帮助 整理 了 
本 书 的 部 分 章节 ; 陈 一 栋 、 页 南 在 毕业 实习 过 程 中 为 本 书 第 十 三 章 做 了 部 分 工作 ; 本校 教 
务 处 激光 照排 中 心 的 同志 们 为 本 书 的 计算 机 录入 和 排版 做 了 大 量 的 工作 ， 作 者 谨 此 一 并 至 
ARRE. 

当 国 内 外 系统 、 深 入 地 阐述 这 方 而 的 教材 或 专著 尚 属 鲜 见 的 时 候 ， 我 们 为 能 向 该 
者 奉献 此 书 而 感到 高 兴 ; 同时 ， 也 深 感 水 平 所 限 ， 书 中 缺点 和 错误 在 所 难免 ， 恩 请 广 
大 读者 批评 指正 . 


作 者 
1991 年 5 月 于 中 国 科 学 技术 大 学 
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第 一 章 并行 计算 机 与 并 行 计算 模型 


1.1 并 行 计算 机 及 其 分 类 


计算 机 发 展 的 趋势 是 运算 速度 越 来 越 快 ， 存 贮 容 量 越 来 越 大 ， 软 件 越 来 越 丰 富 ， 体 系 结 
构 越 来 越 完善 ， 因 此 ， 处 理 能 力 越 来 越 强 ， 从 早期 的 简单 数据 处 理 到 近年 来 的 复杂 知识 处 
理 ， 都 表明 了 这 一 点 。 计 算 机 发 展 的 历史 表明 ， 为 了 达到 更 高 的 处 理性 能 ， 除 了 提高 元 器 件 
的 速度 外 ， 系 统 结构 也 必须 不 断 改进 ， 特 别 是 当 元 器 件 速度 达到 极限 (比如 光速 ) 时 ， 后 者 
将 成 为 问题 的 焦点 。 计算机 系统 结构 的 改进 ， 主 要 是 围绕 在 同一 时 间 间 隔 内 增加 操作 量 ， 即 
所 谓 的 并 行 处 理 (Parallel Processing) 技 术 . 为 了 并 行 处 理 而 设计 移 计 算 机 系统 称 为 并 行 计算 
机 (Parallel Computer)。 在 并 行 计算 机 上 求解 问题 的 过 程 称 为 并 行 计算 (Parallel Computing). 
在 并 行 计算 机 上 设计 求解 给 定 问 题 的 算法 称 之 为 并 行 算法 (Parallel Algorithm). 

并 行 计算 是 一 个 比较 年 轻 的 领域 ， 因 为 著名 的 阵列 处 理 机 Diac IV. 1975 年 才 开 始 运 
fr; 第 一 台 向 量 流水 机 Cray-1 1976 年 才 交 付 使 用 ; AHE VLSI 的 发 展 ， 使 得 计算 机 的 
价格 急剧 下 降 ， 由 多 个 处 理 器 组 成 的 并 行 计 算 机 才 流 行 起 来 . 

并 行 计 算 机 的 发 展 主要 是 某 些 大 型 应 用 领域 的 要 求 : 如 气象 预报 ， 空 气动 力学 ， 人 工 
智能 ， 卫 星 图 象 处 理 ， 核 反应 堆 数 据 处 理 以 及 军事 上 的 应 用 等 ， 为 了 达到 上 述 高 姓 能 要 
求 ， 除 了 提高 线路 及 器 件 速度 外 ， 主 要 是 改进 计算 机 的 系统 结构 ， 例 如 

(1) 引入 T/ O 通道 : 将 费时 的 L/O 操作 交 给 I O 处 理 器 (通道 ) 去 做 ， 从 而 使 
CPU 集中 在 计算 上 ; 

(2) 交叉 存 贮 : 将 存 贮 体 分 成 多 个 模块 ， 以 达到 并 行 存 取 和 了 诚 少 存 取 冲 突 为 目的 ; 

(3) 高 速 缓冲 存 贮 器 : 减少 主 存 与 处 理 器 的 数据 交换 时 间 ， 平 滑 这 两 者 之 问 的 数据 流 
动 速率 ; 

(4) 指令 先行 : 一 次 取出 适当 多 条 将 要 执行 的 指令 ， 使 得 取 指 令 可 以 与 指令 译 码 同样 快 ; 

(5) 多 功能 单元 : 在 中 央 处 理 器 中 设置 多 个 功能 单元 〈 加 法 、 乘 法 器 等 ) 可 以 提高 单 
一 程序 的 吞吐 量 ， 缩 短 周转 时 间 ; 

(6) 指令 恒 准 和 流水 线 技术 : 在 同一 时 间 人 允许 多 条 指令 在 不 同 的 阶段 按 流水 方式 执行 
不 同 的 操作 ; 

(7) 向 量 处 理 技术 : 一 条 向 量 指令 可 以 同时 处 理 n 个 分 景 ， 它 们 可 以 网 时 在 各 个 处 理 
器 中 进行 运算 ， 也 可 以 连续 地 送 入 流水 线 中 进行 重 琶 处 理 ; 

{8) 多 道 程序 设计 : 同时 把 若干 作业 放 在 内 存 中 ， 人 允许 在 同一 时 间 有 多 道 程序 处 于 运 
行 状态 ; 

(9) 分 时 系统 : 允许 多 个 终端 用 户 同 时 交互 地 使 用 同一 台 计 算 机 

(10) 数据 驱动 : 5S C 诺 依 虹 计算 机 不 同 ， 它 不 是 采用 指令 驱动 操作 ， 而 是 采用 操 
作 数 GE) 了 驱动 操作 ， 这 样 如 有 多 个 操作 数 准 备 就 绪 时 ， 就 可 以 第 此 并 行 地 执行 而 不 受 指 
令 顺序 执行 的 限制 ， 从 而 可 以 充分 开拓 并 行 度 ， 
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LLL 并 行 计算 机 介绍 
首先 我 们 介绍 现 有 的 一 些 典 型 并 行 计算 机 ， 以 增加 大 家 的 感性 认识 。 这 里 不 去 描述 幼 

节 ， 仪 仅 讨 论 一 下 并 行 计算 机 的 类 型 、 结 构 特点 和 运行 方式 。 

1. 阵列 处 理 机 (Array Processor)?! 


图 1.1 iliacIV Maes 


有 名 的 Iliac IV 就 是 阵列 结构 
的 。 如 图 1.1 所 示 ，64 个 PE(Pro- 
cessing Element) 各 自 带 有 局 部 存 贮 器 
M， 它 们 排 成 8x 8 的 阵列 ， 每 个 PE 
均 可 和 它 的 上 ， 下 . 左 、 右 四 个 相 邻 
的 PE 相连 。 所 有 PE 在 同一 控制 器 
控制 下 ， 按 同一 指令 要 求 对 不 同 的 数 
据 进行 操作 ， 从 而 达到 操作 级 并 行 。 
2. 流水 线 处 理 机 (PipelincProccsson 

将 生产 流水 线装 配 技 术 应 用 于 计 
算 机 结构 中 ， 把 计算 机 的 运算 部 件 或 
控制 部 件 等 装配 成 一 些 有 序 的 子 部 
件 ， 利 用 功能 部 件 分 离 与 时 间 重 分 办 
法 ， 使 每 个 被 操作 对 象 处 在 整个 燥 作 
流程 的 不 河 功能 部 件 中 ， 且 保持 在 不 


同 的 完成 阶段 ， 从 而 达到 操作 级 的 并 行 ， 这 种 结构 的 计算 机 称 之 为 流水 线 处 理 机 ， 亦 叫 向 
量 机 。 流 水 线 思 想 首先 应 用 于 指令 的 操作 上 ; 继 之 在 功能 划分 的 基础 上 ， 以 流水 线 方式 组 
成 高 速 中 央 处 理 器 ; 进而 出 现 了 在 一 全 机 器 的 中 央 处 理 器 设置 多 条 专用 流水 线 ， 计 它们 并 
行 工作 或 协同 完成 一 些 复合 操 作 . 这 种 系统 对 向 量 加 工 其 为 有 效 ， 是 目前 解决 大 型 数值 计 


算 问 题 巨 型 机 的 主要 型 式 。 


图 1.2 Star-100 机 器 框图 


poe = 
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Star-100 是 典型 的 流水 线 向 量 处 理 机 加 .如 图 1.2 所 示 ， 它 由 CPU、 主 存 、 外 转机 
及 盘 、 站 和 外 部 设备 组 成 . 
3, 多 处 理 机 {Multiproecessor) 和 多 计算 机 (Multicomputer) 

多 处 理 机 (多 处 理 器 ) 和 多 计算 机 是 由 一 些 可 编程 的 且 可 各 自 执行 自己 程序 的 多 个 处 
理 器 组 蕊 .其 中 ， 多 处 理 机 以 各 处 理 器 共享 公共 存 贮 器 为 特征 ; 而 多 计算 机 以 各 处 理 器 经 
通信 链 路 传递 消息 为 特征 。 它 们 与 阵列 机 的 根本 区 别 在 于 : 阵列 机 中 每 个 处 理 器 只 能 执行 
中 央 处 更 器 的 指令 ， 而 后 者 可 以 执行 自己 的 指令 ， 这 样 可 以 达到 指令 级 、 任 务 级 的 并 行 。 

如 图 1.3 所 示 ， 在 多 处 理 机 系统 中 ， 如 果 所 有 处 理 器 都 通过 一 个 中 央 开 关机 构 (如 公 
共 总 线 、 交 叉 开关 ， 包 开关 等 ) 去 访问 全 局 共享 存 贮 器 ， 则 这 种 形式 的 多 处 理 机 称 之 为 紧 
耦合 多 处 理 机 (Tightly Coupled Multiprocesson) 系 统 ， 美 国 卡 内 基 一 梅 隆 大 学 的 C ,wp 就 
是 一 个 著名 的 紧 而 合 多 处 理 机 系统 MM，。 同 紧 艳 合 多 机 系统 不 同 ， 若 每 个 处 理 器 各 自 有 一 个 
局 部 存 贮 器 ， 所 有 的 局 部 存 贮 器 地 址 空间 加 在 一 起 形成 整个 共享 存 贮 空间 ， 则 这 样 的 多 处 
理 机 系统 称 为 松散 看 合 多 处 理 机 (Loosely Coupled Multiprocesson AY. AAA BURG ÍT 
多 处 理 机 没有 集中 的 开关 机 构 ， 所 以 可 连接 大 量 的 处 理 器 ， 卡 内 基 一 梅 隆 大 学 的 Cs RS 
一 个 著名 的 松散 耦合 的 多 处 理 机 系统 四 如 图 1.4 所 示 。 
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14 C; 多 处 理 机 结构 框图 

Ca 采用 了 机 群 (Group) 结 构 ， 目 前 已 研制 成 的 系统 共有 50 台 DEC LSI-11 微型 计 
算 机 ， 用 三 级 总 线 (LSI-11 BR. Map 总 线 以 及 群 间 双 总 线 ) 连 接 起 来 ， 其 中 又 mop 负责 
把 各 个 计算 模块 所 带 有 容量 为 28K 字 的 局 存 组 织 在 一 起 ， 形 成 统一 的 具有 28 位 地 址 的 虚 
WALZ. 

上 面 我 们 介绍 的 几 种 并 行 计 算 机 基本 上 都 还 是 在 泽 . ERE ERA. AME TE 
多 非 汝 . 诺 依 曲 机 ， 如 数据 流 计算 机 (Data Flow Machine)， 归 约 计算 机 (Reducion Machinc)， 推 理 
计算 机 (nferenoe Machine? Sci t fed E SOR (Neural Networks Machine 等 ， 虽 然 都 是 新 一 代 计 算 
机 ,但 目前 在 这 些 机 器 上 研究 的 并 行 算 法 尚未 成 染 ， 除 了 神经 网 机 外 ， 基 它 的 不 在 介绍 之 列 。 
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1.1.2 ”并行 计 算 机 分 类 


1. Flynn 分 类 法 中 

1966 年 ，M.J.Flynn 提出 了 著名 的 Flynn 分 类 法 .他 按 指令 流 及 数据 流 将 计算 机 系 
统 分 为 四 大 类 。 

(1) 单 指令 流 单 数据 流 : SISD(Single Instruction Stream Single Data Stream) 计 算 
机 ， 这 就 是 传统 的 串 行 计算 机 

(2) 单 指令 流 多 数据 流 : SIMD(Single Instruction Stream Multiple Data Stream) 计 算 
机 ， 上 一 节 所 述 的 阵列 机 ， 流 水 线 处 理 机 均 属于 此 类 计算 机 

(3) 多 指令 流 单数 据 流 : MISD(Multiple Instruction Stream Single Data Stream) 计 算 
机 。 此 关 计 算 机 是 否 存 在 尚 有 疑 议 。 

(4) 多 指令 流 多 数据 流 : MIMD(Multiple Instruction Stream Multiple Data Stream) 
计算 机 ， 上 一 节 所 述 的 多 处 理 机 和 多 计算 机 均 属 此 类 计算 机 。 

2. Handler 分 类 法 

1977 4£, Handler 根据 计算 机 系统 中 流水 线 和 并 行 度 出 现 的 级 别 ， 将 一 台 计算 机 表 
示 为 三 对 整数 。 令 PCU 代表 处 理 器 控制 单元 ， 它 相当 于 一 个 外 理 器 或 CRPU; ALU 代表 
算术 敢 辑 运算 单元 ， 它 相当 于 功能 单元 或 处 理 单元 ，BLC 代表 位 一 级 电路 。 于 是 ， 按 照 
Handler 分 类 法 ， 一 台 计 算 机 可 表示 为 

T(C)- < KXK', Dx D',WxW'> 
其 中 : 丘 = PCU 的 数 日 ; 

&' = 能 够 流水 执行 的 PCU 数 目 ; 

D = fT PCU BEAM ALUAL A 

D' = 能 够 流水 执行 的 ALU 数 月; 

W = ALU RAEM JEPE HENG 

W' = 在 所 有 ALU 或 单个 PE 中 流水 线段 数 . 
上 式 中 ， 如 朵 任 一 对 整数 的 第 二 个 元 索 值 为 1， 则 就 略 去 它 ， 在 单一 计算 机 系统 中 ， 符 号 
“x "可 用 于 描述 不 同 种 类 处 理 器 的 连接 。 

如 CDC 6600 计算 机 ， 它 有 一 个 CPU; ALU 有 10 个 功能 单元 ， 它 们 者 可 以 流水 地 
执行 ; CDC 6600 字 长 60 位 ; 最 多 有 10 AHE I/O 处 理 器 ， 它 们 可 以 与 CPU 并 行 地 
工作 ， 每 个 1/ O 处 理 器 有 一 个 字 长 12 位 ALU， 这 样 ， 

T(CDC 6609)= 了 (中 央 处 理 器 ) x TO/ O 处 理 器 ) 
一 <1,1x10,60> x <10,1,12> 
然而 ，Handier 分 类 又 过 于 依赖 机 器 ， 日 前 大 家 都 普 记 遵循 Flynn 分 类 法 。 


1.0 ”并 行 计算 模型 


计算 模型 是 算法 的 实现 基础 。 并 行 算法 的 设计 产 格 地 依 天 其 计算 模型 。 对 问 一 问题 而 
言 ， 完 全 可 能 有 许多 不 辐 的 并 行 算法 以 适应 在 不 同 的 模型 上 对 这 一 问题 的 求解 。 
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关于 并 行 计算 模型 已 有 人 做 了 大 量 的 研究 工作 ， 在 这 里 我 们 不 打算 给 各 种 并 行 计算 模 
型 做 一 个 系统 的 总 结 ， 仅 仅 介绍 一 些 公认 的 计算 模型 . 


BEMAR Id 


图 1.5 SIMD 计算 模型 


前 面 介绍 的 几 种 并 行 计算 机 ， 它 
们 是 并 行 算法 的 物质 基础 但 对 算法 
的 研究 者 而 言 ， 不 能 仅 局 限于 某 种 其 
体 并 行 机 而 研究 并 行 算法 ， 必 须 从 算 
法 角度 ， 将 各 种 并 行 机 的 基本 特征 加 
以 理想 化 ， 抽 象 出 所 亩 的 并 行 计算 模 
型 ， 然 后 在 此 模型 上 研究 和 发 展 各 种 
有 效 的 并 行 算法 。 为 此 ， 我 们 在 并 行 
计算 模型 中 对 多 处 理 器 并 行 机 作 如 下 
一 些 假定 : 

(0) 处 理 器 数目 假定 : ERA 
限 . 前 者 是 指 算法 中 可 使 用 随 问题 规 
模 (大 小 或 尺寸 ) nt 成 高 阶 多 项 式 增 
长 的 处 理 器 数 ; 后 者 则 是 用 p 个 处 理 
器 去 求解 问题 (ps 2); 

D HARE: 每 个 处 理 器 抠 行 


指令 或 数据 操作 的 时 间 相 同 ， 且 与 处 理 器 数目 多 少 无 关 ; 


{3) 存 取 假定 : 允许 多 个 处 理 器 


同时 读 ， 写 一 个 共享 存 贮 单元 ， 或 不 
允许 这 样 做 ; 

(4) 指令 集 假定 : 每 个 处 理 器 具 
有 普通 计算 机 所 拥有 的 指令 集 ， 如 算 
RARER. WA. RA 输出 等 
指令 。 

一 般 而 言 ， 并 行 计算 模型 可 分 为 
专用 并 行 结构 和 道 用 并 行 结构 。 所 谓 
专用 并 行 结构 是 专门 为 有 效 解决 菜 一 
类 特定 问题 而 设计 的 一 种 并 行 结构 ， 
如 用 于 排序 和 选择 的 比较 器 网 络 
(Comparator Network", 基于 VLSI 
BORN Systolic 阵列 "3， 这 种 模型 是 
由 Kung 提出 的 ， 由 于 它 具 有 结构 规 
整 ， 且 以 流水 方式 操作 ， 很 适 
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Im 


ASRS a ood 
* 


控制 操 x 


用 1.6 MIMD 计算 模型 


合 于 数值 计算 ,还 有 一 种 VLSI BO, XXRRIUEHEZE Bur EXEAJRCT LET 
件 线路 的 计算 模型 ， 其 中 每 个 处 再 部 件 完成 单一 的 逻辑 功能 ， 处 理 部 件 之 问 通过 线路 连接 
通讯 ， 由 于 VLSI 具有 将 算法 渗透 于 硬件 中 的 特性 ， 近 几 年 颇 受 人 们 重视 ， 记 谓 通 用 并 行 
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结构 是 为 了 解决 广泛 的 应 用 问题 而 设计 的 一 种 并 行 结 构 。 根 据 Flynn 分 类 法 ， 通 用 并 行 
结构 可 分 为 SIMD 及 MIMD 两 大 类 . 这 两 大 类 还 可 进一步 细 分 为 基于 共享 存 贮 的 SIMD 
及 MIMD 计算 模型 和 基于 互连网 络 的 SIMD 及 MIMD 计算 模型 。 它 们 分 别 如 图 1.5 及 
图 1.6 所 示 ， 


1.2.1 SIMD 共享 存 贮 模型 


共享 存 贮 模 型 是 一 种 理想 的 计算 模型 ，Fortune 等 人 1 最初 描述 的 共享 存 贮 模 型 是 : 
假定 存在 一 个 容量 无 女 大 的 共享 存 迪 器 一 并 行 随机 存 取 机 器 PRAM (Parallel Random 
Access Machine)， 潭 时 有 有 限 {Bound) 或 无 限 (Unbound) 个 功能 相同 的 处 理 器 ， 每 个 处 理 
器 拥有 简单 的 算术 运算 和 逮 辑 判断 功能 。 在 任何 时 刻 ， 任 何 一 个 处 理 器 均 可 通过 共享 存 贮 
器 的 共享 单元 同 其 它 任何 处 理 器 互相 交换 数据 ， 但 根据 处 理 器 对 共享 单元 存 取 的 不 同 约束 
条 件 又 进一步 分 为 : 

(1) 不 允许 同时 读 和 同时 写 (Exclusive-Read and Exclusive-Write), fei, SK 
仅 允 许 一 个 处 理 器 读 或 写 某 一 个 共享 单元 。 这 种 计算 模型 简 记 为 SIMD-EREW 
PRAM; 

(2) 允许 间 时 读 ， 但 不 允许 同 肘 写 (Concurrent~Read and Exclusive- Write). Aji 
说 ， 每 次 允许 任意 多 个 处 理 器 同时 读 一 个 共享 单元 的 内 容 ， 但 每 次 仅 允 许 一 个 处 理 器 向 某 
个 共享 单元 写 内 容 。 这 种 计算 模型 简 记 为 SIMD-CREW PRAM; 

(3) 允许 同时 读 和 和 写 (Concurrent~Read and Concurrent—Write), BI RULERS 
个 处 理 器 同时 读 和 六 时 写 同 一 个 共享 存 贮 单元 .这 种 计算 模型 简 记 为 SIMD-CRCW 
PRAM, 

ERE ALPE, ABR CAT eC EO) PERO 
型 SIMD-EREW PRAM 和 最 强 的 计算 模型 SIMD-CRCW PRAM. Snir 已 证 明了 
SIMD-EREW PRAM }" #3 F SIMD-CREW PRAM!"*, Cook 等 人 则 又 证 明了 
SIMD~CREW PRAM 严格 能 于 SIMD-CRCW PRAM!" 因此， 车 Ty 表示 一 并 行 算 
法 在 一 并 行 计算 模型 M 上 的 时 间 ， 则 

Trew > Torew? TcRcw 

在 SIMD-CRCW PRAM 上 ， 人 允许 许多 处 理 器 同时 向 一 共享 单元 写 内 容 ， 虽 然 这 是 不 现实 
的 。 为 了 解决 这 种 “号 " 引 起 的 冲突 。、Kucera 曾 提 册 三 种 解决 “号 冲突 "的 方法 四， 它们 分 别 是 : 

(1 仅 汪 “1 的 处 埋 器 写成 功 ; 

Q) 写 和 人 相册 内 容 的 处 理 器 写成 切 ; 

{3) 优先 权 域 高 的 处 理 器 写成 功 . 

而 且 他 还 证 明了 在 以 处 理 器 为 代价 的 前 提 下 ， 这 三 种 解决 “ 写 冲 突 " 方 法 的 时 间 复 杂 件 是 一 
致 的 。 最 近 Fich 等 人 更 进一步 分 析 了 在 处 理 器 数 及 共享 单元 数 月 都 受 限制 的 迟 况 下 ， 这 
EXT D ELE MAU p E 

1979 4E, Eckstein 曾 采 用 二 叉 树 方法 来 解决 读 穷 冲突 问题 ”"， 为 了 解决 读 引 起 的 冲突 ， 只 
人 允许 一 个 处 理 器 从 共享 单元 取 内 和 容 ， 然 后 通过 树 向 所 有 其 它 处 理 器 广播 此 数据 ， 为 了 解决 写 
冲突 ， 将 树 作为 一 种 竞赛 (TournamenD 机 构 ， 确 保 仅 有 一 个 处 理 器 泽 内 容 ， 这 样 ， 一 个 具有 时 
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问 复杂 性 了 和 空间 复杂 人 性 5 的 、 在 SIMD-CREW PRAM 或 SIMD-CRCW PRAM 上 的 算 
法 ， 在 SIMD-EREW PRAM 上 模拟 实现 时 ， 其 复杂 性 分 别 为 : 
Tergw = OlTerEw * 10gp)= O(Torcw * logp) 
Serew = O(Screw * P= O(Screw * P) 

其 中 为 处 理 器 数目 ， 可 见 ， 用 二 叉 树 解决 读 窟 冲突 问题 是 费 空 间 的 ， 

1983 4£, Vishkin 曾 提出 了 另外 一 种 解决 读 写 冲突 方法 趾 ， 所 得 结果 是 : 

Tppew 7 OT crew * log p) O(Tercw * log'p) 
Szrew = O(Screwt P) 7 O(Scucw P) 

显然 ， 在 空间 上 是 省 多 了 ， 但 却 增 
加 了 时 间 复 杂 性 ， BZ. MARI 
冲 罕 ， 应 很 好 地 考虑 时 、 空 平衡 . 

在 现实 的 各 种 并 行 计 算 机 中 ， 
若 不 考虑 处 理 器 之 问 的 通信 开销 几 
平 是 不 可 能 的 ， 通 信 开 销 在 算法 中 
黄 至 占 主导 地 位 。 而 上 述 基于 共享 
| mem 存 贮 的 并 行 计算 机 是 不 存在 的 。 人 

们 之 所 以 乐于 采用 它 ， 是 因为 它 抛 

开 了 各 种 其 体 的 体系 结构 ， 使 人 们 
能 够 集中 精力 ， 从 问题 本 身 出 发 ， 研 究 和 发 展 竺 求解 问题 本 身 固 有 的 并 行 性 以 及 并 行 计 算 
的 复杂 性 ， 从 而 使 得 并 行 算法 的 研究 成 为 一 项 独立 的 活动 。 


图 127 HEA SMD 模型 


1.2.2 SIMD 互连网 络 模型 

SIMD 互连网 络 模型 是 一 种 比较 切合 实际 的 并 行 计算 模型 ， 许 多 实验 用 的 和 商品 生 
产 的 并 行 计算 机 几乎 都 是 基 呈 左 连 网 络 结 构 的 。 而 基于 点 连 网 络 连接 的 SIMD 机 器 又 分 
为 两 大 类 。 一 类 是 处 理 器 一 处 理 器 之 问 直接 蕊 连 〈 又 称 为 图 房 式 )， 另 一 类 是 处 理 器 一 一 
存 贮 器 之 间 直 接生 连 〈 又 称 为 舞厅 式 )， 它 们 分 别 示 于 赂 1.7、1.8 中 。 

词 房 式 适用 于 处 理 器 利 存 迪 器 数目 


相等 的 场合 ; 而 舞厅 式 适 用 于 存 贮 器 数 BEN 
ALTERAM. UME r 
度 来 讲 ， 两 者 并 无 木质 的 差别 . 因此 ， [Roe] mec] e 
我 们 仅 限于 讨论 田 房 式 这 一 类 。 PETT | 
F 面 我 们 列举 一 些 常 用 到 的 互 连 则 一 = -J 
络 模 型 。 MEM, | MEM: a MEM ， 
L 一 维 线性 模型 
一 维 线性 阵列 (Linear Array), JE 图 1.8 HETA SIMD HUS 


VEHI CAL PTFE TT OL BS I Be TA Ip ET, AC Pek SB a 
GAL KD E 【第 一 个 和 地 后 一 个 处 理 器 例外 )， 这 种 连接 方式 是 Systolic 结构 中 
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的 最 基本 形式 ， 
车 有 个 处 理 器 组 成 一 维 线性 阵列 ， 处 理 器 编 号 依次 为 G6，1，2，…，x-1， 则 线性 
阵列 的 连接 消 数 LC 定义 如 下 : 
LC4()-iél lxixz-l 
LC, (Q=i-1 O<i<n2 
其 中 i 是 对 应 处 理 器 编号 ，LC., 表示 左 连 接 ，LC 表示 右 连接 。 
2. 网 孔 模 型 
首先 我 们 介绍 最 简单 的 二 维 网 孔 连接 (2D Mesh-Connected) 模 型 ， 然 后 再 给 出 一 般 的 
qo 2) 维 网 孔 连 接 模 型 。 
在 二 维 网 孔 连 接 处 理 器 阵列 中 ， 处 理 器 按 二 维 阵列 形式 排列 ， 每 个 处 理 器 仅 与 四 个 相 
邻 处 理 器 (车 存在 的 话 ) 有 线 互 连 。 如 图 1.9(a) 所 示 。 二 维 网 孔 阵 列 有 许多 变种 ， 例 如 边 
界 处 理 器 也 有 线 连接 的 丙种 方式 ， 如 图 1.9(b) 及 (c) 所 示 ， 


(a) 不 带 绕 回 连接 的 网 筷 。 (5) 相同 行 或 列 的 处 理 器 之 问 带 绕 回 连接 的 网 孔 (0) HRI ER LBENNO ATL 
19 二 维 网 孔 连接 
在 二 维 网 所 上 处 理 器 的 编号 方式 常见 的 行 主编 号 、 洗 有 牌 编号 以 及 蛇 形 编号 ， 它 们 分 别 图 示 
于 图 1.10 的 (a)、(b) 及 (c) 中 。 


(a) 行 主编 号 [DE ET (c) 站 形 行 主编 号 
110 处理 器 三 种 编号 方式 
对 于 有 多 个 处 理 器 组 成 的 二 维 网 孔 阵列 。 若 边界 处 理 器 的 互 连 方 式 和 图 1.10(c) 相 癌 ， 而 
处 理 器 编号 以 行 主 方式 进行 ， 则 处 理 吕 之 间 的 互 连 函数 MC 为 : 
MC_()=(-1) mod n 
MCn(D= (1) mod n 
MC  () - (— Vn) mod n 


MC -@=(i+ Vn) mod n (0<i<n) 
其 中 : i 是 处 理 器 编号 ，MC-_ 及 MC 表示 MTR. MC y 及 MC ,表示 i 的 列 


连接 . 图 1.11 给 出 n= 16 的 二 维 网 孔 的 互 连 方式 。 
a b c d 


图 111 n=16 的 二 维 网 孔 


在 二 维 网 孔 模 型 上 ， 已 设计 出 
许多 有 效 的 排序 、 选 择 、 和 矩阵 运算 
以 及 图 论 等 方面 的 并 行 算法 。 但 网 
孔 结构 的 通信 功能 较 差 ， 在 最 坏 情 
况 下 ， 任 意 两 处 理 器 之 间 的 信息 交 
换 步 至 少 需要 V7 一 1 e 

9- 维 网 孔 模 型 是 二 维 网 孔 模 
HHE. BEK n AE, dX 
n GAREY 9 一 维 晶 格 空间 的 
eR bs cm. QL. i eR 
一 个 正 整 数 ，1< jj <q. TH 
FAG) doc o0) 上 的 处 理 器 P, 与 
BEF HR) 2) 土 的 处 


理 器 了, 有 线 互 连 ， 当 上 且 仅 当 它 们 之 间 的 距离 P, P)-1, HF 


dP, P) - Xi, - 4l 


4 一 维 网 孔 模 型 在 证 明 网 孔 上 实现 的 并 行 算法 的 下 界 时 常常 用 到 .。 


3. 树 机 模型 


二 叉 树 是 大 家 非常 熟悉 的 一 种 数据 结构 。 除 了 根 结 点 外 ， 每 个 非 叶 结 点 都 与 父 结 点 和 
两 个 儿子 结 点 有 线 连 接 。 若 一 棵 满 二 叉 树 有 4 级 〈 编 号 自 根 至 叶 为 0 到 41), 


则 共有 n= 2-1 个 结 点 。 图 1.12 示 
Wy d=4 的 一 标 满 二 又 树 机 ， 其 中 
根 结 点 和 叶 结 点 具有 I/O 操作 功 
能 。 树 机 的 典型 工作 方式 是 ， 叶 结 点 
对 数据 进行 并 行 计算 ， 而 内 部 结 点 仅 
负责 叶 结 点 间 的 通信 及 简单 的 逻辑 运 
A. AW, Kung 等 人 曾 提出 叶 结 点 
是 SIMD 计算 机 ， 而 非 叶 结 点 是 简 
44 Systolic 比较 器 的 树 机 模型 ， 如 图 
1.13 BER. 


OR 


图 1.12 四 级 二 又 树 机 


由 于 树 根 结 点 往往 成 为 通信 的 瓶颈 ， 为 此 有 人 建议 在 同一 晨 结 点 之 问 也 使 用 线 连 接 起 
来 ， 这 就 是 所 谓 X 一 树 中 ， 如 图 1.14 Stm. 显然 ，X 一 树 明显 的 改善 了 树 机 的 通信 功能 . 


4 超 立方 及 立方 环 模 型 


一 个 由 4 = 2” 个 处 理 器 组 成 的 q— 维 超 立方 计算 模型 ， 处 理 器 与 处 理 器 / 有 线 
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连接 当 且 仅 当 i 与 /的 二 进 制 表示 仅 一 位 不 同 , Ob jan 


图 1.45 给 出 了 4=4 的 4 维 超 立 方 ， 若 处 理 器 编号 i 的 二 进 制 表示 i oy WR 
的 互 连 函数 CC 为 : 
ce, 


=i 


aleam ad d, ami m i i a eee E, omis 


WT, -1—1,. 0«k«q. 


PAHA 


Systolic 计算 机 


Systolic 计算 机 


图 1.13 楷 状 并 行 计算 机 的 体系 结构 


< 


图 1.14 n= 25-108 X- 


n-8 的 立方 连接 网 络 ( 单 级 ) RE 
1.16， 其 中 CC, 将 地 址 第 0 位 不 同 的 那 大 
理 器 相连 ; CC 将 地 址 第 1 位 不 同 的 那 址 
理 器 相连 ; CC, 将 地 址 第 2 位 不 同 的 那 址 
理 器 相连 .实际 上 ， 三 种 连接 函数 合 在 一 址 
组 成 一 个 立方 体 -。 

Siegel 的 研究 表明 : 超 立 方 模 型 是 一 连 

图 45 人 4 维 直立 方 用 的 计算 模型 ， 它 可 以 模拟 很 多 其 它 形式 大 
连 网 络 59、 但 在 一 般 情况 下 ， 每 个 处 理 器 将 同 Clog m 个 处 理 器 连接 ， 当 问题 规 的 
大 时 ， 从 制造 技术 上 讲 是 不 可 接受 的 ， 因 而 从 某 种 意义 上 讲 限 制 了 超 立方 模型 更 可 
anu. 

1981 年 Preparata 等 人 建议 了 超 立方 模型 的 一 种 变种 — 327; M (Cube-Connected 
cles)， 简 记 为 CCCP4， 它 结合 了 环 网 和 超 立 方 连接 的 优点 ， 使 得 每 个 处 理 器 仅 与 三 个 
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它 处 理 器 互 连 、 这样， 处 理 器 之 间 的 连 线 数 目 与 问题 规模 无 关 ， 这 一 点 对 VLSI 的 实现 是 
极其 重要 的 、 


O aA [B4 aee. 


‘ 2 ? d d n p à p thee. 


(a) n= 8 的 立方 体 (b) n=8 的 立方 连接 网 络 
图 1.16 立方 连接 网 络 


CCC 构造 如 下 : 假定 n= 2° 个 处 理 器 ， 其 中 4 一 + 42’, FERT > d 
整数 ， 则 CCC 的 环 内 线 连 楼 与 环 之 间 的 线 连 接 定义 如 下 : 

HA: 编号 为 j 的 处 理 器 辣 编号 为 (j+ 1) mod 2' 的 处 理 器 用 线 连 搂 起 来 ，0 < j 
«n. 


环 同 : 编号 为 《12' eg) 的 处 理 器 同 编号 为 V + 了 + 0 21 2 ) 处 理 器 互 连 ，0 


«Ix2* , 0« j«2. 
其 中 : ndi 1 的 二 进 制 数 表示 的 第 7 位 〈 最 右边 为 
第 0 位 )， 即 六 =O BR 1, (1-21, 2 3C 1 
进 制 第 /位 取 反 。 可 见 ， 每 个 环 是 由 2 个 连 线 连 
HTT RY. SAFRA. GE 2 个 环 )。 阁 将 
每 个 环 上 的 处 理 器 都 视 为 以 此 环 为 代表 的 超 顶 点 ， Sé 
UFR Z IBI ERR PO 维 超 立方 。 图 1.17 
给 出 了 一 个 m= 32(q=5, r=2) CCC 网络。 ESE 
A= 个 环 ， 每 个 环 内 共有 2 = 4 处 理 器 。 Bq 

每 个 处 理 器 编号 的 二 进 制 表 示 有 4 位. 这 4 位 WAN 
WETA- TB, DRESS En Li ker — 
SER, pit 了 个 二 进 制 位 。 若 一 处 理 器 编号 为 
i W D'vp-i O<i<n, 每 个 处 理 器 含有 三 个 与 
其 它 处 理 器 的 连接 函数 ， 它 们 分 别 是 F(Forward)，B(Backword) 和 L(Lateral, EX 
如 下 : 

环 内 : F(p) 连 向 BE(P+ 1) mod 2”) 

B(Lp) 连 向 F(l, (p—1) mod 2") 


23 20 Q 19 


图 1.17 2=32 W CCC 结构 


—11— 


环 闻 : L(,p) 连 向 F4 e2*, p. s— 1-21, 


Galit 等 人 证 明了 CCC 是 一 种 非常 有 效 的 通用 计算 模型 ?3， 它 可 以 有 效 地 模拟 许 将 
其 它 互 连 网 络 ， 


5. AM- SED 
洗 牌 一 交换 (Shuffile-Exchangej 是 另 一 类 非常 有 用 的 互 连 结构 、 洗 牌 的 名 字 来 源 于 ' 牌 
N a ] BWER HIS — BONO HR 
CÓ X 0 AN (€N 两 半 ， 然 后 依次 从 两 半 中 各 一 
tg iq HARM, RA 
Nese ^ in H5) NM Perfect Sh 
Ssa fle)， 有 时 也 称 之 为 混 洗 . 
1.18 n= 8 的 洗 牌 交换 网 络 洗 址 函数 作为 一 种 连接 阔 数 


往往 不 充分 ， 所 以 常 将 它 与 交换 函数 配合 使 用 ， 形 成 了 “ 洗 牌 一 交换 "网 络 ， 有 时 也 简称 
洗 牌 网 络 . 

简单 地 讲 ， 车 有 个 处 理 器 组 成 一 个 洗 牌 模型 ， 那 么 处 理 器 间 连 接 方式 为 : 编号 为 
的 处 理 器 同 编号 为 (2 六 1) 的 处 理 器 互 连 ， 编 号 为 (H+p/ 2) 的 处 理 器 同 编号 为 2i 的 处 理 器 
E; 编号 为 (2 六 1) 的 处 理 器 与 编号 为 2; 的 处 理 器 互 连 (i=1，2，…，p/ 2). XETP— BERI 
个 处 理 器 组 成 的 洗 牌 网 络 而 言 ， 设 处 理 器 ;的 二 进 制 表示 为 imisi MERRE 
函数 如 下 : 


Shuffle, |i Did) —d Gh arm si, 


Unshuffle(i, 


-iii =i i 


arfaa iati o) T HE, Vm 


8-1 garhi) i atathai 
pF, =1-i,, O<b<q. BR, Vent 
的 功能 实际 上 循环 左 移 一 位 ， 逆 洗 牌 功能 


实际 上 是 循环 右 移 一 位 ; 而 交换 的 功能 则 


Exchange(i 


CX CUN 

是 将 地 址 相 邻 的 两 处 理 器 数据 进行 交换 。 入 < BS) 

图 1.18 给 出 了 a= 8 的 洗 牌 网 络 ， 其 Py 7 /人 
中 实 线 表 示 Exchange 函数 ， 而 虚线 表示 \ \ \ 1 
Shuffle Hie. ? $ b $ 

洗 牌 交换 网 络 ， 由 于 它 能 方便 地 模拟 jw; «7 i 
超 立方 网 络 的 功能 ， 且 每 个 处 理 器 仅 同 其 oy NI 
它 三 个 处 理 器 互 连 ， 因 而 受到 计算 机 工作 LF A y 
者 广泛 注意 ， 但 由 于 它 连 线 的 不 规整 性 ， 
给 布局 带 来 了 很 大 的 困难 ， 图 1.19 4x4 的 树 图 
6 树 网 模型 


从 通信 角度 来 讲 ， 树 结构 明显 优 于 网 孔 结构 ， 但 网 孔 结构 有 它 的 优点 ， 将 这 两 者 优 
起 来 ， 发 展 成 为 一 种 新 型 互连网 络 模型 一 - 树 网 (Mesh-of-Tree) 模 型 。 树 网 的 构造 ， 简 
来 讲 ， 将 所 有 处 理 器 按 二 维 阵列 形式 安排 ， 然 后 每 行 及 每 列 的 处 理 器 再 按 完全 二 又 树 网 
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连接 起 来 (它们 分 别 作为 二 叉 树 的 叶 结 点 )。 如 图 1.19 所 示 。 

这 样 ， 可 通过 相应 的 行 料及 列 树 进行 通信 ， 由 于 这 种 结构 既 具 有 良好 的 通信 功能 ， 又 
继承 网 扎 上 很 多 的 有 效 算法 ， 同 时 它 也 非常 适合 于 VLSI 集成 化 ， 故 在 这 种 结构 上 已 发 展 
了 许多 有 效 的 并 行 算法 ， 

7. 金字 塔 模型 

人 金字塔 (Pyramid) 模 型 是 由 树 与 网 孔 结合 
而 成 的 。 这 种 结构 在 图 象 处 理 等 领域 颇 为 有 
用 ,一 个 由 O( 六 个 处 理 器 组 成 的 金字 塔 ， 十 
一 标高 度 为 logsp 的 完全 四 叉 树 ， 而 四 叉 树 的 
每 层 处 理 器 又 按 二 维 网 孔 方式 互 连 。 其 中 
pal? 是 二 维 网 筷 形式 的 金字 塔 塔 底 ,金字塔 
层 数 由 底 向 上 从 0 开始 编号 ， 且 塔 顶 只 有 一 个 
MHS, 58 UZIS TMABES SHEA 
au, LP 处 理 器 互 连 。 它 们 分 别 是 : 第 H 层 的 父 结 
© 点 ; 第 天 层 的 四 个 儿子 结 点 以 及 同一 层 的 四 
个 相 邻 结 点 (车 它们 分 别 存 在 的 话 )、 因 此 一 
个 高 为 logap 的 金字 塔 共 有 (4p-1)/ 3 个 处 理 


图 1.20 p=16 的 金字 塔 结构 器 ， 图 1.20 是 p= t6 的 金字 塔 . 
8. WERE 
蝶 形 (Butterfly) 结 构 是 与 FFT 密切 相关 的 一 fo 


| 种 互 连 结构 。 从 拓扑 结构 上 讲 ， 它 与 多 级 立方 网 
络 ， 榕 树 网 络 和 归并 网 络 颇 为 相似 ， 如 图 1.21 
所 示 。 它 共有 (K+1)2* 个 结 点 ， 组 成 (E+1) 行 (第 0 
行 至 第 上 行 )， 其 中 第 0 行 和 第 TUS 
同 ， 且 每 行 有 n=2 个 结 点 .车 令 PE, O<r< 
k 0x ig n) 代表 处 于 第 + 行 第 i 列 的 处 理 器 ， 
那么 在 第 r(r> 0) 行 上 的 处 理 器 PE 将 连 向 ?8 
PE, 1;， 其 中 j =i 或 j 与 i 的 二 进 制 表示 仅 第 + 5 3o 
位 不 同 (从 左 数 )。 

在 鱼 形 结构 上 已 研究 出 一 类 并 行 排序 及 图 1.21 k—3, n—8 BOER 
FFT «iE, 
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1. MIMD 共享 存 贮 模型 

SIMD 寞 型 同 MIMD 模型 的 一 个 显著 差别 ， 前 者 有 一 个 全 局 控制 器 ， 而 后 者 没有 全 
局 控制 器 ， 在 MIMD 共享 存 贮 模型 中 ， 假 定 存在 一 个 无 限 大 的 共享 存 贮 器 ， 每 个 处 理 器 
各 自 完成 自己 的 子 任务 ， 但 为 了 完成 整个 任务 ， 各 处 理 器 之 间 需 要 交接 数据 ， 这 可 由 同步 
抽 制 实现 ， 也 就 是 说 ， 通 过 共享 存 贮 变量 实现 各 处 理 器 之 问 的 通信 。 在 这 种 模型 上 开发 的 
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算法 称 之 为 异步 并 行 算法 (Asychronous Parallel Algorithm). 

A MMD 共享 存 贮 模型 周 现实 相差 甚 远 ， 目 前 在 它 上 面 开发 的 并 行 算法 非常 有 限 。 
2. MIMD 异步 通信 模型 

一 个 基于 异步 通信 的 分 布 式 计算 模型 可 以 抽象 为 一 个 无 向 图 GE, Hp TARI 
对 应 处 理 机 集合 ， 边 集合 EE 对 应 处 理 机 间 的 双 疝 通信 和 链 集合 。 每 个 处 理 机 都 有 一 个 唯 的 
的 编号 。 而 且 每 个 处 理 机 内 知道 邻接 处 理 机 (有 线 直接 互 连 的 处 理 机 ) 这 一 局 部 知识 , 理 
理 机 之 间 的 通信 是 通过 发 送 和 接收 消息 完成 的 、 处 理 机 之 间 不 存在 共享 存 贮 器 。 在 算法 行 
行 期 间 ， 假 定 处 理 机 及 通信 链 均 不 能 出 现 故 障 (Fail)。 每 个 处 理 机 除了 执行 自己 的 计算 务 
务 外 ， 还 向 邻接 处 理 机 发 送 消 息 以 及 接收 、 处 理 来 自 邻 居 的 消息 ， 并 假定 这 些 操作 所 需 时 
时 间 呵 处 理 机 阅 通 信 时 间 比 较 起 来 可 以 忽略 不 计 . 每 个 处 理 机 发 送 给 邻接 处 理 机 的 消息 有 
有 限 的 、 不 确定 的 时 间 内 到 达 ， 且 在 一 条 通信 线 的 同一 方向 上 的 消息 到 达 目 标的 次 序 服 机 
“先进 先 出 (FIFO)" 规 则 。 

在 基于 异步 通信 的 分 布 式 计算 模型 上 没 计 的 算 汰 称 之 为 分 布 式 算法 (Distributs 
Algorithm)， 其 主要 衡量 标准 是 算法 的 通信 复杂 性 以 及 道 信和 所 花费 的 时 间 ， 
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本 章 概述 了 并 行 算法 的 一 些 基 础 知识 ， 主 要 内 容 包括 : 并 行 计算 机 的 发 展 简 史 和 现 的 
的 几 种 著名 的 并 行 计算 机 ; 以 及 并 行 计算 机 的 分 类 法 。 着 重 介绍 了 SIMD 机 器 上 两 种 型 
型 的 计算 模型 : (1) 基 于 共享 存 贮 的 模型 有 SIMD-EREW PRAM. SIMD-CREPR 
PRAM 以 及 SIMD-CRCW PRAM， 并 对 它们 之 间 的 相互 模拟 进行 了 一 些 讨论 ，(2) 于 
于 互连网 络 的 模型 ;: 有 一 维 线性 阵列 、 网 孔 、 树 机 、 超 立方 及 立方 环 、 洗 牌 一 交换 、 疯 
网 、 金 字 塔 和 螺 形 网 络 等 ， 最 后 扼要 介绍 了 MIMD 机 器 上 基于 共享 存 贮 模型 及 基 二 异 送 
通信 的 互连网 络 模型 。 本 章 介绍 的 模型 是 后 面 各 章 要 介绍 的 并 行 算法 的 物质 基础 。 另 了 竹 
本 章 还 介绍 了 并 行 算法 中 的 一 些 常用 的 基本 概念 ， 
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第 二 章 并行 算 法 的 度量 与 设计 技术 


2.1 并 行 算法 的 基本 概念 


算法 是 解 题 方法 的 精确 描述 ， 它 由 一 组 有 穷 规则 组 或 ， 这 些 规则 规定 了 解决 某 一 特定 
类 型 问题 的 一 系列 运算 ， 所 谓 并 行 算法 ， 简 单 地 讲 ， 就 是 适合 于 在 各 种 并 行 计算 机上 求解 
问题 的 算法 ， 

1980 Æ Kung 曾经 给 并 行 算法 下 了 一 个 精确 的 定义 9， 即 : 并 行 算法 是 一 些 可 同时 执 
行 的 诸 进 程 的 集合 ， 这 些 进程 相互 作用 和 协调 动作 ， 从 而 达到 对 给 定 问题 的 求解 。 

并 行 算法 可 以 从 不 同 的 角度 加 以 分 类 : 数值 计算 和 非 数值 计算 的 ; 网 步 的 、 异 步 的 和 
分 布 式 的 ; SIMD SLAY. MIMD 机 器 上 的 和 VLSI 模型 上 的 等 等 ， 

所 谓 数 值 计 算 (Numerical Compnutation) ， 是 指 基于 代数 关系 运算 的 一 类 计算 问 
题 ， 诸 如 矩阵 运算 、 多 项 式 求 值 、 解 线性 方程 组 等 。 它 基本 上 属于 数值 分 析 ( 对 以 数字 形 
式 表示 的 问题 求 数值 解 ) 的 范畴 . 

所 谓 非 数值 计算 (Non-numerical Computation)， 是 指 基于 比较 关系 运算 的 一 类 计 
算 问 题 ， 诸 恕 排序、 选择、 搜索、 匹配 以 及 图 论 等 方面 的 计算 问题 ， 基 本 上 是 属于 符号 
(如 人 字符、 数字 、 图 象 等 ) 处 理 的 范畴. 

因此 ， 我 们 把 面向 数值 计算 和 非 数 值 计算 的 并 行 算法 分 别称 之 为 数值 计算 的 并 行 算法 
和 和 非 数值 计算 的 并 行 算法 。 

同步 算法 (Synchronized Algorithm) 是 指 某 些 进程 必须 等 待 别 的 进程 的 一 类 并 行 
算法 。 因 为 一 个 进程 的 执行 ， 依 粮 于 输入 数据 以 及 系统 中 断 ， 所 以 多 部 进程 均 必须 同步 在 
一 个 给 定 的 时 钟 ， 以 等 待 最 慢 的 进程 。 

一 般 地 讲 ， 运 行 在 SIMD 机 只 模 型 上 的 并 行 算法 称 为 同步 并 行 算法 (Synchronous 
Parallel Algorithm). 

异步 算法 (Asychronized Algorithm) 基 指 诸 进 程 的 执行 一 般 不 必 相 互 等 待 的 一 类 并 行 算 
法 。 在 这 种 情况 下 ， 进 程 通 信 征 通过 动态 地 读 到 (修改 ) 共享 存 贮 器 的 全 局 变量 来 实现 . 

一 般 而 言 ， 运 行 在 MIMD 共享 存 迪 模型 上 的 算法 称 之 为 异步 并 行 算法 
(Asychronous Parallel Algorithm). 

所 谓 分 布 式 算法 (Distributed Algorithm)， 是 指 基 于 异步 通信 模型 上 说 计 的 一 类 算 
法 ， 这 一 类 算法 的 典型 特征 是 : 通过 消息 通信 来 协同 整个 问题 的 求解 。 

VLSI 并 和 算法 (VLSI Paralel Algorithm) 是 指 在 VLSI 计算 模型 上 开发 的 一 类 并 行 算法 . 
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在 SIMD 机 器 模型 上 的 算法 是 同步 的 并 行 算 法 .在 MIMD 机 器 模型 上 的 算法 一 般 义 
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可 分 为 三 类 : 流水 线 (Pipelining) 算法 、 划 分 (Partitioned) 算法 以 及 张驰 (Relaxed) 算 
法 . 
l 流水线 算法 

一 个 流水 线 算法 就 是 一 组 有 序 的 程序 自 ， 其 中 前 一 段 的 输出 将 是 下 一 段 的 输入 。 算 法 
的 输入 就 是 第 一 段 的 输入 ; 算法 的 输出 就 是 最 后 一 段 的 输出 。 象 通常 生产 流水 线 一 样 ， 所 
有 的 眉 必 须 以 相同 的 速率 产生 结果 ， 否 则 最 慢 的 段 将 成 为 瓶颈 口 。 有 的 作者 称 此 类 算法 是 
宏 流 水 线 算 法 (Macropipelining Algorithm). 

脉动 算法 (又 称心 动 算 法 ，Systolic Algorithm) 也 是 一 类 特殊 的 流水 线 算法 。 它 有 
三 个 基本 属性 : 数据 的 流动 有 节奏 、 有 规律 ; 数据 的 流向 可 以 多 于 一 个 方向 ; 各 段 执行 的 
运算 基本 一 致 ， 在 一 个 Systoli 算法 中 ， 要 求 产 生 数据 的 进程 与 消耗 数据 的 进程 之 闻 隐 含 
着 同步 的 机 制 。 
2 划分 算法 

划分 (Partitioning) 是 一 种 分 治 思 想 : 将 一 个 大 问题 划分 成 规模 大 致 相等 的 子 问题 ， 然 
后 在 各 个 处 理 器 上 单独 求解 这 些 子 问题 ; 最 终 将 所 有 解 合并 起 来 即 给 出 原 问 题 的 解 。 将 各 
处 理 器 的 解 合 并 在 一 起 就 隐 合 着 同步 ， 所 以 划分 算法 也 称 为 同步 算法 。 

划分 算法 分 为 两 类 : 预 调度 算法 (Preschedule Algorithm) 和 自 调度 算法 
(Self-Scheduled Algorithm). 前 者 在 编译 时 分 配 任务 ， 后 者 在 运行 时 动态 指派 任务 ， 当 
一 个 计算 是 由 大 量子 任务 完成 ， 而 且 每 一 个 子 任务 均 知道 其 复杂 度 时 ， 适 宜 于 使 用 预 调度 
算法 .在 自 调度 算法 中 ， 必 须 保 持 待 完成 的 任务 表 ， 一 旦 一 个 进程 闲 时 ， 另 一 任务 就 从 等 
待 表 中 移出 。 进 程 调度 本 身 也 作为 程序 运行 ， 因 此 称 之 为 自 调 度 、 
3, 张弛 算法 

进程 执行 的 进展 不 需 辣 步 而 等 待 的 算法 称 之 为 张驰 算法 。 所 有 进程 都 可 以 朝 同 一 月 标 
(如 划分 算法 那样 )， 或 可 以 有 某 种 特殊 展 的 〈 如 流水 线 算法 那样 ) 工作 之 ， 但 决 不 存在 一 
个 处 理 器 停 下 等 待 另 一 个 处 理 器 所 供 数 据 。 张 驰 算法 的 特征 是 ， 诸 处 理 器 能 够 使 用 墩 新 有 
效 数据 。 正 是 因为 张驰 算法 的 不 确定 行为 ， 致 使 预言 其 性 能 变 得 困难 。 


2.3 并行 算法 的 度量 标准 
2.3.1 算法 复杂 性 的 基本 概念 


一 个 算法 的 复杂 性 〈Complexity)， 也 叫 复 杂 度 ， 是 指 它 含有 的 工作 量 . 例如 ， 在 让 
行 算法 (又 称 顺 序 算法 ) 中 ， 算 法 的 复杂 性 是 指 算法 的 运算 量 〈 即 时 间 步 ) SACE F 
迪 空 间 )。 它 们 都 是 求解 问题 的 规模 函数 . 当 问 题 的 规模 上 趋向 无 穷 大 时 ， 我 们 就 得 到 算 
法 复杂 性 的 渐 近 表 示 。 一 般 而 言 ， 我 们 关心 的 是 = 很 大 时 的 复杂 性 ， 这 时 它 与 渐 近 复杂 人 性 
相差 不 多 ， 在 算法 分 析 时 ， 往 往 对 这 两 者 不 予 区 分 。 

在 对 算法 复杂 性 进行 分 析 时 ， 我 们 常 使 用 上 界 ( Upper Bound) 、 下 界 (Lower 
Bound) 以 及 精确 界 (Tightly Bound) 概念 。 下 面 我 们 就 精确 地 定义 这 些 基本 概念 . 

Df) 和 gn) 是 定义 在 自然 数 集合 N 上 的 两 个 函数 ， 如 果 存 在 两 个 正常 数 c 及 
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ny 使 得 对 所 有 n>m 均 有 
f(n) &c * g(n) 


则 称 a(n) 是 fn) 的 一 个 上 界 ， 记 作 f(n)  O(g(n)). HER: 在 求 f(n) 的 上 界 时 总 是 试图 
求 出 最 小 的 a(n), EE f(n) = 0 (g(n)). 


如 果 存 在 两 个 正常 数 c 及 n。， 使 得 对 所 有 的 n > np HA 
Sa) > c+ a(n) 


JU a(n) E (n) 的 一 个 下 界 ， 记 作 f(n) =O). 同样 的 ， 在 求 SOD 的 下 界 时 ， 总 是 试 
图 求 出 最 大 的 g(n)， 使 得 (n) = Ugo). 


如 果 存 在 正常 数 c,，c， mu， 使 得 对 所 有 的 > n。， 均 有 
eit ala) < fm) <e, * a(n) 
则 eh ftm) 的 精确 界 ， 也 称 紧 致 界 ， 记 作 f(n)=B(g(n))。 注 意 : 一 个 算法 的 复杂 性 
f(n)7 @(g(n))， 就 意味 着 此 算法 在 最 好 及 最 坏 情况 下 的 复杂 性 在 一 个 常量 因子 范围 内 是 
相同 的 。 
从 算法 复杂 性 角度 ， 我 们 又 可 把 算法 分 成 两 大 类 : 凡是 复杂 性 函数 上 界 是 多 项 式 界 的 
算法 称 之 为 多 项 式 复杂 性 算法 (Polynomial Complexity Algorithm), 而 复杂 性 函数 上 界 是 指 
数 界 的 算法 称 之 为 指数 复杂 性 算法 (Exponential Complexity Algorithm). 
几 种 常见 的 多 项 式 与 指数 复杂 性 函数 关系 如 下 : 
O(1) < O(logn)? < O(n) < (O(nlogn) < O(n”) < O(n”) 
OQ") « O(n!) < O(n") 


图 2.1 给 出 了 几 种 函数 曲线 之 间 相 互 关 
系 。 


232 并行 算 法 的 复杂 性 度量 
算法 可 用 不 同 的 标准 度量 ， 但 我 们 
主要 关心 的 是 算法 与 求解 问题 规模 之 间 
的 关系 。 对 于 一 个 给 定 的 具有 规模 的 
问题 ， 通 常 有 各 种 可 能 的 输入 集合 。 在 
b 算法 分 析 时 ， 对 算法 的 所 有 输入 分 析 其 
. 平均 复杂 性 称 之 为 期 望 复杂 性 (Ex- 
ET pected Complexity}， 为 了 分 析 算 法 的 
Boni 几 种 常见 的 函数 曲线 期 望 复杂 性 ， 往 往 需要 对 输入 的 分 布 作 
某 种 假定 。 在 大 多 数 情况 下 ， 这 并 非 很 容易 ， 所 以 我 们 感 兴趣 的 是 分 析 在 某 些 输入 时 ， 使 
得 算法 的 处 理 帘 数 及 计算 时 间 最 大 的 情况 下 算法 的 复杂 性 ， 这 时 的 复杂 性 称 为 最 坏 情 况 下 
的 复杂 性 (Worst-Case Compiexity)。 因 此 ， 在 后 面 各 章节 我 们 讨论 的 复杂 性， 不 言 而 喻 
的 都 是 指 最 坏 情 况 下 的 复杂 性 。 


ORPHAN log 均 以 2 为 底 。 
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在 SIMD 计算 模型 上 的 并 行 算法 ， 我 们 将 研究 算法 的 运行 时 间 和 所 需 的 处 理 器 数目 
以 及 在 最 坏 情 况 下 ， 它 们 与 问题 规模 n 的 关系 ， 

(1) BAA): 送行 时 间 就 是 在 并 行 计算 机 上 求解 给 定 问 题 所 需 的 时 间 。 即 算 
法 从 开始 执行 到 算法 执行 结束 所 经 过 的 时 间 ， 此 时 间 通 常 由 两 部 份 组 成 : 数据 从 一 个 处 
理 器 经 互连网 络 到 达 另 一 个 目标 处 理 器 的 选 路 (Routing) 时 间 !,， 以 及 在 一 个 处 理 器 内 执 
行 的 算术 和 逐 辑 等 运算 需要 的 运算 时 间 !. ， 通 常 ， 两 者 分 别 用 选 路 时 间 步 以 及 计算 时 间 
步 计算 之 。 

(2) ”处 理 器 的 数 上 月 p(n): 求解 给 定 问题 所 需 的 处 理 器 数目 ， 显 然 它 是 问题 规模 ”的 
函数 。 和 根据 当今 并 行 计算 机 的 实际 水 平 ，p(n) > n 是 不 合适 的 ， 特 别 是 相当 大 时 ， 通 
常 p(n) 应 是 WERE BB (Sublinear Function)， 虽 然 pin) = logn 或 p(n)= n? 也 
是 = 的 亚 线 人 性 函数 ， 可 它们 的 取 值 对 于 实际 的 并 行 计算 机 而 言 并 不 灵活 . Ble. pn) 具 
体 选取 应 视 具体 并 行 系统 而 定 。 通 常 将 p(n) 限制 为 p(n) =n'“， 其 中 0<s<1。 

在 MIMD 计算 模型 上 ， 对 基于 共享 存 迪 的 算法 其 时 间 还 应 包括 同步 等 ， 它 们 
M SIMD 模型 上 复杂 性 度量 基本 一 致 .而 对 基于 异步 通信 的 分 布 式 计算 模型 ， 其 算法 的 
衡量 标准 主要 有 两 个 : 

(1) ”通信 复杂 性 : 是 指 算法 在 整个 执行 期 间 所 传送 的 消息 总 数目 ; 这 又 分 为 基本 长 
度 消息 总 数 ， 或 传送 消息 的 二 进 制 位 数 总 和 ; 

Q) ”时间 复杂 性 : 是 将 算法 从 第 一 台 处 理 机 上 开始 执行 到 最 后 一 台 处 理 机 上 终止 的 
这 段 时 间 间 隔 。 

电 于 在 基于 异步 通信 的 分 布 式 计算 模型 中 ， 处 理 机 之 间 传 递 的 消息 到 达 目 的 地 的 时 
闻 是 有 限 但 不 确定 的 ， 同 时 算法 的 执行 时 间 与 处 理 机 互 连 的 拓扑 结构 紧密 相关 ， 要 想 精 
确 地 分 析 算 法 的 时 间 复 杂 人 性 就 变 得 非常 困 此 ,目前 ， 估 算出 的 算法 复杂 性 都 是 假 
定 邻 接 处 理 杭 之 间 的 通信 可 在 O(1) 时 间 内 完成 这 一 假定 基础 上 得 出 的 . 注意: 在 这 种 计 
算 模 型 中 一 般 都 假定 处 理 机 数目 为 O(n)， 有 时 假定 为 p (p < n. 


2.3.3 ”并行 算法 的 性 能 评价 

对 一 个 给 定 的 问题 ， 可 以 设计 出 许多 求解 它 的 并 行 算法 ， 那 么 在 这 众多 的 并 行 算法 
B. PLAS) 这 就 需要 一 个 或 多 个 衡量 标准 。 本 节 将 介绍 评价 一 个 并 行 算 法 的 几 个 公 
认 的 衡量 标准 。 
L 并 行 算法 的 成 本 : c(n) 

并 行 算法 的 成 本 c(m)， 定 义 为 并 行 算法 的 运行 时 间 1(n) 与 并 行 算法 所 需 的 处 理 器 数目 
Bn) BFR, BP 

c(n) = i(n) + pin) 

BEL, RAST ERE FRE ALI AEDT. A AROR RR C DERE 
TAERE., PERILS Le FP BR TRL FFT RE TL RE RT 
并 行 算法 是 成 本 最 优 的 。 
2. dake (又 称 加 速 比 ， 速 度 倍数) : 5,(n) 

令 t, (1) 是 求解 一 问题 的 最 快 串 行 算法 在 最 坏 情 况 下 的 执行 时 间 ，#。fz) 十 求解 同一 问 
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es 


题 的 并 行 算法 在 最 坏 情况 下 的 运行 时 间 ， 则 加 速 (Speedup) 定义 为 : 
ENG — (n^ NO 
WIE S QD) 是 反映 算法 并 行 性 对 运行 时 间 的 改善 程度 标准 ， 很 清楚 ，5 ,(z) 越 大 ， 

表明 并 行 算法 越 好 .在 理想 情况 下 ，3 (n) = p(n)。 若 一 个 并 行 算法 ， 其 加 速 5 (n) 
= p(n)， 则 称 这 个 并 行 算法 是 最 优 的 并 行 算法 (Optimal Parallel Algorithm)。 但 实际 上 
要 达到 S (0) = pin) 几乎 是 不 可 能 的 。 原 因 在 于 在 绝 大 多 数 情况 下 ， 所 求解 的 原始 问题 是 
不 可 能 分 解 成 pm 个 子 任务 ， 以 及 每 一 个 子 任务 在 一 个 处 理 器 上 所 需 时 间 为 单机 时 间 
的 17 pln)， 此 外 ， 并 行 计算 机 为 了 求解 原始 任务 ， 对 各 处 理 器 之 间 的 合作 还 需要 额外 开 
销 。 事 实 上 ， 因 为 任何 并 行 算法 都 能 在 一 台 串 行 机 上 模拟 实现 ， 因 些 ，f,(z) 
x pla) t, 00), AT 


1«$,(00)« po) 

3. 并行 算法 的 效率 : E (n) 

有 时 候 ， 一 个 并 行 算法 虽然 有 好 的 加 速 ， 但 处 理 器 的 利用 率 可 能 很 低 ， 特 别 是 当 处 理 
器 的 数目 p(n) 不 固定 时 ，3 ,(n) 不 是 一 个 最 好 的 评价 标准 ， 为 此 引入 算法 效率 的 概念 ， 所 
谓 并 行 算法 的 效率 ， 可 定义 为 算法 的 加 速 同 处 理 器 数目 之 比 ， 即 

E,(n)= $,0)/ pln) 
WD, E Qr 可 度量 并 行 系统 中 处 理 器 的 利用 情况 ， 由 上 式 可 知 
O<E mI 

在 基于 异步 通信 的 分 布 式 计算 模型 中 ， 通 信 复杂 性 是 主要 衡量 标准 ， 其 次 才 是 计算 复 

A. 


24 并 行 算法 的 表示 及 约定 


描述 一 个 算法 ， 速 常 可 使 用 非 形式 描述 和 形式 化 描述 两 种 。 所 谓 非 形式 描述 就 是 用 

通常 的 自然 语言 来 表达 ; 所 谓 形式 化 描述 是 使 用 某 种 程序 设计 语言 将 算法 书写 出 来 ， 在 可 
能 的 情况 下 ， 我 们 尽量 使 用 算法 的 形式 化 描述 。 选 用 语言 时 ， 其 基本 要 求 用 该 语言 所 写 出 
的 语句 不 能 有 二 义 性 ， 同 时 要 强调 直观 ， 易 理解 ， 而 不 苛求 严格 的 语法 格式 。 象 品行 算法 
中 选用 语言 一 样 ， 类 Algol 或 Pidgin — Algol 或 类 Pascal 等 语言 均 可 被 选用 .本 书 使 用 的 
是 两 者 混和 体 ， 

在 并 行 算法 的 表达 中 ， 所 有 串 行 算法 的 语句 及 过 程 均 可 被 调用 ， 而 为 了 表达 并 行 性 ， 
我 们 引入 几 条 并 行 语句 : 

(1) for each i,,i,,"°,/,:P pardo 


plar 


endfor 
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BRAGA Gii) 的 处 理 器 ， 若 满足 谓词 为 真 ， 则 执行 循环 体 的 指令 序列 ， 其 
H i, 是 一 个 大 于 等 于 0 的 有 限 整数 。 

(2) upon receiving M message from u do: 
表示 某 结 点 一 旦 收 到 一 个 来 自 结 点 u 的 消息 M 后 ， 就 执行 相应 的 计算 。 

HE: 为 了 程序 的 简洁 ， 在 意义 明确 的 前 提 下 ， 参 数 类 型 说 明 总 是 省 去 的 ， 而 
H "begin" “end” 总 出 现在 一 个 算法 或 一 个 子 过 程 的 头 部 和 尾部 。 我 们 用 “一 “ 表示 赋 
值 ， 而 “和 二 ”表示 在 互连网 络 中 ， 将 数据 从 一 个 处 理 器 放 人 另 一 个 处 理 器 的 过 程 。 

最 后 ， 应 强调 的 是 : 本 书 中 的 各 种 并 行 算法 的 表示 ， 不 要 求 统一 格式 ， 视 描述 方 
便 ， 或 采用 非 形式 化 描述 ， 或 用 形式 化 描述 ， 且 在 意义 表达 明确 的 前 提 下 ， 人 允许 并 行 算 
法 的 多 种 表达 方式 。 

为 今后 叙述 方便 ， 约 定 一 个 有 向 (无 向 ) 图 是 G(V,E)，IVY|=n，|El= m。 图 的 直径 
Hades. EG 是 有 向 图 ， 则 有 和 疝 边 eeE， 用 一 对 “ 尖 括 号 ”表示 ， 即 e = cuv. 
这 表示 e 的 方向 由 w 指向 v; 车 G 是 无 向 图 ， 我 们 用 一 对 刚 括 号 表示 边 ， 如 eeE,e 


= (u,v). 


2.5 并 行 算法 的 设计 技术 


2.1. 几 种 基本 的 设计 技术 

为 解决 某 一 给 定 问 题 而 设计 一 个 并 行 算法 ， 基 本 上 存在 两 种 设计 方法 : 一 种 是 对 这 一 
问题 的 申 行 算法 进行 改造 、 移 植 ， 开 发 其 固有 的 并 行 性 ， 使 之 适用 于 在 并 行 计算 机 上 运 
行 ， 这 种 直接 从 申 行 算法 转换 到 并 行 算法 是 很 有 意义 的 .因为 这 样 一 来 ， 大 量 的 串 行 算法 
都 可 移植 到 并 行 机 上 运行 ， 然 而 ， 也 存在 一 些 限制 ， 官 月 地 将 一 个 串 行 算法 转换 成 一 个 并 
行 算法 ， 常 常会 导致 失败 ， 原 因 在 于 某 些 有 效 的 串 行 算法 大 有 的 顺序 性 〈 如 DFS 算法 ) ， 
很 难 开发 出 其 中 的 并 行 性 来 ， 而 且 一 个 高 效率 的 申 行 算法 也 不 一 定 会 导致 一 个 高 效率 的 并 行 
算法 。 相 反 ， 有 时 一 个 性 能 不 好 的 串 行 算法 ， 却 有 可 能 直接 转换 成 性 能 良好 、 人 快速 的 并 行 算 
法 。 另 一 种 是 从 问题 描述 本 身 出 发 ， 挑 弃 现 在 的 此 问题 品行 算法 思想 ， 从 头 开始 设计 一 个 全 
新 的 并 行 算法 . 此 种 方法 看 来 似乎 存在 一 些 技巧 ， 但 也 不 是 无 章 可 循 的 ， 近 年来， 入 们 力图 
寻求 设计 并 行 算法 的 一 些 通用 策略 。 但 就 目前 的 研究 状况 来 看 ， 这 些 通用 设计 技术 还 十 分 有 
限 .普遍 用 到 的 有 : 分 而 治之 策略 23， 以 及 它 的 一 个 变 体 瀑布 分 而 治之 策略 (Cascading Di 
vide-And-Conquer Strategy)j 和 4， 路 径 折 登 技术 (Path Doubling Technique)”, MRA 
(Tree Cotraction Technique) (9 以 及 选 代 改 进 (Iterated Improvement E RIA. FI 
我 们 将 介绍 几 种 基本 设计 技术 ， 
L 分 而 治之 技术 
将 一 个 大 的 问题 分 解 成 个 大 致 相等 的 子 问题 ， 然 后 在 每 个 处 理 器 对 相应 的 子 问题 
求解 ， 最 后 将 各 处 理 器 上 得 到 的 部 分 解 合 并 起 来 ， 就 得 到 原 问题 的 解 。 
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例如 : BEAN ERa. a, 


用 分 而 治之 技术 解决 这 个 问题 


ca, Ap POMBE Y ap pen. 


如 下 : 首先 对 每 个 处 理 器 分 配 元 素 : 每 个 处 理 器 至 多 会 


&/ PANTER: 我 们 分 配 编号 为 :的 处 理 器 的 元 素 是 a oy ipee e a zuo 1 <i<p 
- 第 p 个 处 理 器 分 配 剩 下 的 m £n pO AYRGERS BUFR auc pie n 


feats 


a,。 然后 每 个 编号 为 i 的 处 理 器 计算 它 内 部 元 素 的 和 了 ,~ E a, 最 后 这 p 个 处 


理 器 合作 将 这 些 部 分 和 加 起 来 得 出 


PT 


原 问题 的 解 。 


下 面 我 们 分 析 上 述 算法 复杂 性 ; 每 个 处 理 器 计算 部 分 和 需 O( Tn / pU) 时 间 ; 然后 p 


个 处 理 器 计算 立 了 , = O(logg) 时间 


， 故 整个 算法 需 O(n / pt logp) 时 间 、0O(p) 处 理 器 . 


最 近 Atallah 等 人 基于 Cole 的 归并 排序 过 程 发 展 了 一 种 他 们 称 之 为 瀑布 分 而 治之 技术 ， 他 


们 论证 了 这 种 技术 在 设计 并 行 算法 中 
2 路径 折 又 技术 


， 尤 其 是 设计 计算 几何 问题 的 并 行 算法 中 非常 有 用 。 


Wyllic 的 路 径 折 释 技术 最 先 应 用 于 链表 结构 ， 这 里 我 们 通过 一 个 例子 来 说 明 这 种 技术 . 


BA “个 元 素 的 单 向 链表 ， 计 : 
表 计 数 问题 (List Ranking Proble: 


算 该 链表 每 个 元 察 后 面 链 接 的 元 素 个 数 。 这 就 是 所 谓 的 


m). 


设 表 长 为 m 除 表 尾 一 个 元 素 外 ， 其 它 每 个 元 素 i 都 有 一 个 指向 其 后 继 元 素 的 措 针 
D(). 若 表 最 后 一 个 元 素 为 5 WAE D()-"NIL, D(D())- DO). 设 第 i 个 在 链表 中 元 


素 后 面 链接 的 元 素 个 数 为 CGf ). M 


算法 2.1 LIST RANKING PRO 
procedure LRP(D,C) ; 
begin 
(1) for each i: 1« 
Cel; 


下 述 过 程 将 完成 链表 计数 。 


BLEM 


ign pardo / * Rati+ / 


if ¿=+ then C(i) - 0 endif 


endfor ; 
(2) for kei to T 
for each i: 


lognl do 
:I1«i&n pardo 


QU CO-C-COG); / * FACES Ak A nn 7 
Q2)  D()e-DU(); 
(23) if i-i then C(i) - 0 endif; 


endfor 
endfor 


end. 
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所 渭 路 径 折 登 ， 主 要 体现 在 过 程 的 第 (2.2) 步 .这 个 算法 的 一 个 形象 说 明 如 图 2.2 所 示 . 


地 址 1 2 3 4 5 


22 n=8 的 链表 计数 算法 执行 过 程 

在 SIMD — CREW PRAM 上 ， 上 述 过 程 需 O(logn) HA. Ot) 个 处 理 器 . 

这 种 路 径 折 元 技术 已 广泛 地 应 用 到 并 行 算 法 设计 中 。 
3， 选 代 改 进 技术 

迭代 改进 技术 最 初 是 由 了 arp 等 人 提出 的 。 这 种 技术 并 不 锭 其 它 技术 那样 ， 一 开始 就 
急于 寻求 疝 题 的 解 ， 而 是 通过 许多 次 近代 逐步 改进 ， 最 后 才 给 出 问题 的 解 。 每 次 迭代 称 
为 一 个 阶段 ， 每 个 阶段 的 工作 是 使 后 选 解 的 个 数 减少 一 个 常量 因子 ， 这 样 ， 一 个 规模 n 
的 问题 需 O(logn) 次 迭代 就 可 得 到 原 问 题 的 解 。 

下 面 通过 一 个 例子 来 说 明 这 种 技术 的 应 用 。 首 先 我 们 定义 图 G(V,E) 的 独立 集 。 一 个 
图 G 的 一 个 独立 集 了 是 顶点 集 V 的 子 集 I Ss y， 且 了 中 任意 两 个 顶点 都 设 有 边 连 接 . 
G 的 一 个 极 大 独立 集 (Maximal Indepent Set) 了 指 的 是 : 1 是 一 个 独立 集 ， 且 它 不 真 
正 包 含 在 男 一 个 独立 集中 。 今 后 我 们 将 极 大 独立 集 简 记 为 MIS. 

FSEV, N,() EX SEG 中 的 邻 集 WN (S)= {wiwer BRE u 
ES，({u,w)eE}。 有 了 上 述 定义 ， 下 面 举 一 例 子 . 

已 知 一 无 向 图 G(V,E), BOR G 的 MIS. Karp 等 人 曾 用 送 代 疏 进 技术 对 这 一 问题 建 
议 了 一 个 并 行 算法 、 他 们 的 算法 简单 地 描述 如 下 : 


算法 2.2 MAXIMAL INDEPENDENT SET PROBLEM 
procedure Maximal Independent Set (G,V,£) ; 
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begin 
( Iep; Hev; / +7 是 G 的 极 大 独立 集 * / 
{2) while H s do 
(2.1) San independent set in induced subgraph H ; 
Q2) I-Io8; 
Q3) H«—H-(SUN (S); 
/+ 除去 独立 集 3 及 其 邻接 顶点 后 ， 剩 下 的 顶点 导出 的 子 图 * / 
endwhile 
end. 


上 述 算法 始终 维持 一 个 集合 了 最 终 它 将 成 为 极 大 独立 集 。 在 每 一 迭代 阶段 ( BI while 循 
环 执行 一 次 }， 不 在 了 内 的 顶点 数目 、 或 同 了 内 顶点 相 邻 的 顶点 数目 都 显著 地 减少 。 

Karp 等 人 证 明了 在 SIMD — CREW PRAM 上 ， 极 大 独立 集 问 题 的 并 行 算法 
48 O(log n) BY. O(n? / 10g n) 处 理 器 。 

运用 和 迭代 改进 技术 ， 已 经 研究 出 了 许多 有 效 的 MIS 并 行 算法 及 平面 图 着 色 的 并 行 算 
P 

树 压缩 技术 是 基于 树 结构 上 执行 一 系列 操作 技术 ， 这 里 就 不 介绍 了 . 另外 近年 来 又 
发 展 了 所 谓 的 确定 性 硬币 投 捞 (Deterministic Coin Tossing) AR 以 及 破 对 
称 {Symmetry — Breaking) 技术 中 ， 这 些 技术 都 是 设计 有 效 并 行 算法 的 有 用 技术 . 


2.52 设计 并 行 算法 应 注意 的 几 个 问题 

在 设计 一 个 并 行 算法 时 ， 有 一 些 基本 的 因素 应 牢记 在 心中 . 

(1) 计算 问题 的 并 行 性 开发 : 对 于 一 个 具有 内 在 并 行 性 的 计算 问题 ， 我 们 必须 根据 
不 同 的 计算 模型 ， 改 变 计 算 问 是 的 运算 操作 之 间 的 相互 关系 ， 分 析 其 相关 性 ， 将 其 划分 成 
若干 个 能 彼此 并 行 执行 的 子 问题 。 注 意 ， 使 用 不 同 的 划分 方式 ， 将 会 产生 不 同 风格 的 并 行 
算法 . 

(2) ”必须 考虑 通信 成 本 : 在 基于 共享 存 贮 的 并 行 计 算 模 型 上 ， 由 于 处 理 器 之 间 的 通 
信 征 通过 全 局 共享 存 喧 变量 完成 的 ， 因 而 通信 开销 常常 忽 赂 不 计 . 但 在 基于 互连网 络 结 
构 的 并 行 计算 模型 上 ， 在 决定 并 行 算法 的 复杂 性 时 ， 不 考 虚 通信 开销 是 不 行 的 ， 有 时 候 
通信 复杂 性 比 计算 复杂 性 还 要 高 ， 也 就 是 说 ， 数 据 在 处 理 器 之 间 选 路 所 花费 的 时 间 比 实 
际 处 理 、 变 换 所 花费 的 时 间 还 要 长 ,例如 ， 在 某 一 特定 的 多 计算 机 上 执行 一 次 浮 点 加 法 
运算 需 1 个 单位 时 间 ， 而 将 一 个 浮 点 数 从 一 个 处 理 器 传送 到 另 一 个 处 理 器 需要 1001 个 单 
位 时 间 ， 车 在 p 个 处 理 器 的 并 行 系统 中 对 个 浮 点 数 进行 加 法 运算 ， 且 假定 这 个 浮 点 
数 开始 时 都 在 局 部 存 贮 器 中 ， 那 么 ， 当 n < 101 时 ， 不 管 处 理 器 的 个 数 p 多 大 ， 在 由 单个 
处 理 器 的 计算 机 上 执行 这 严 个 数 的 浮 点 加 法 总 比 用 多 个 处 理 器 同时 并 行 执行 泽 点 如 要 
快 

O ”算法 有 粮 于 计算 模型 : 一 个 算法 的 性 能 在 不 同 计算 模型 上 差别 很 大 。 有 时候 ， 
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是 由 于 如 上 所 述 的 通信 开销 所 致 ， 但 有 了 时候 是 由 另外 一 些 因素 引起 的 。 例 如 ， 在 SIMD 
计算 模型 上 同步 是 自动 实现 的 ， 但 在 MIMD 计算 模型 上 它 要 通过 很 费时 间 的 软件 来 实 
现 。 所以， 通常 在 同步 之 间 执 行 很 少 运算 的 一 类 算法 ， 在 MIMD 共享 存 贮 机 器 上 运行 的 
效率 是 很 差 的 。 

4) 算法 与 数据 的 存 赔 分 布 有 关 : 例如 ， 在 作 和 矩阵 运算 时 ， 年 阵 元 素 在 各 存 贮 模块 
中 可 以 有 不 同 的 存 贮 方式 。 假 定 有 4 个 存 贮 模 块 ， 和 矩阵 元 素 按 如 下 方式 存 贮 : 


如 果 按 行 或 对 角 线 方式 存 取 符 阵 元 素 ， 则 4 1 2 3 4 FERRES 
个 存 迪 模块 可 以 同时 工作 ;而 如 果 按 列 存 取 an n fg dy 
矩阵 元 素 ， 则 4 个 模块 不 能 同时 工作 . 25 ay iy a, 
O 并 行 算法 与 串 行 算法 的 性 质 不 a aaa 
同 : FSP HR RAR un 


河 ， 同 时 并 行 算法 还 要 考虑 通信 开销 以 及 辅 44 In Ta fy 

助 开销 ， 而 不 具有 顺序 算法 严格 的 顺序 继承 性 ， 所 以 在 诸如 收敛 性 、 稳 定性 和 售 人 误差 等 
方面 ， 并 行 算法 的 性 质 都 不 同 于 串 行 算 法 、 对 这 些 问题 ， 在 设计 并 行 算法 时 都 要 给 予 分 析 
ARIE. ' 


2.6 小 E 


本 章 主要 表述 了 并 行 算法 的 基本 概念 、 衡 量 标准 及 性 能 评价 标准 。 并 行 算法 的 衡量 参 
数 主要 有 运行 时 间 、 使 用 的 处 理 器 数目 等 ， 分 布 式 算法 还 包括 通信 复杂 性 。 并 行 算法 性 能 
评价 的 主要 指标 是 : 成 本 、 加 速 、 效 率 等 ， 

本 章 除了 介绍 了 并 行 算法 的 基本 概念 外 ， 还 介绍 了 并 行 算法 的 几 种 常见 的 设计 技术 
如 分 而 治之 技术 、 路 径 折 要 技术 和 选 代 改进 技术 .同时 约定 了 并 行 算法 的 表示 .最 后 ， 指 
出 了 在 设计 并 行 算 法 时 应 注意 的 若干 问题 . 
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第 三 章 图 的 搜索 


3.1 图 的 并 行 搜索 


搜索 是 解决 图 论 问 题 的 一 种 基本 技术 ， 它 是 许多 图 论 算法 的 基础 .传统 的 搜索 技术 有 
深度 优先 搜索 (DFS) 及 宽度 优先 搜索 (BFS) 两 种 搜索 技术 。 这 里 介绍 这 两 种 技术 以 及 
它们 结合 在 一 起 的 宽 - 深 优先 搜索 技术 的 并 行 化 。 

假定 计算 模型 是 SIMD-CREW PRAM. Reghbati 和 Corneil 曾 给 出 了 三 种 图 的 并 
行 搜索 方法 中 我 们 将 介绍 这 些 方法 . 


3.1.1 算法 的 基本 原理 


在 计算 机 中 ， 图 G(V.E) 都 用 适当 的 数据 结构 表示 ， 如 邻接 矩阵 ， 邻 接 表 等 ， 由 于 用 
邻接 矩阵 找 边 的 时 间 开 销 较 大 ， 这 里 采用 邻接 表 来 表示 图 。 在 并 行 环境 下 ， 一 个 图 怎样 才 
能 很 快 地 被 搜索 呢 ? 

开始 时 ， 令 主 表 为 空 。 从 图 中 任 选 一 个 顶点 作为 开始 搜索 的 顶点 ， 并 将 其 放 人 主 表 
中 。 在 任何 一 次 搜索 过 程 中 ， 每 个 处 理 器 首先 把 自己 的 子 表 轩 空 ， 然 后 从 主 表 中 选择 一 个 
待 搜索 的 的 顶点 ， 每 个 处 理 器 各 自 检查 这 个 顶点 的 一 条 或 几 条 关联 边 . 若 关联 边 连接 一 个 
未 被 搜索 的 顶点 ， 则 把 它 放 人 该 处 理 器 的 子 表 中 ,各 子 表 中 存放 着 将 要 并 人 主 表 的 顶点 。 
在 某 个 间隔 点 ， 把 各 处 理 器 产生 的 子 表 链接 到 一 起 并 人 主 表 中 。 

假定 消耗 时 间 的 操作 有 顶点 选择 、 表 链接 和 结合 过 程 ， 并 假定 选择 一 个 顶点 需要 这 类 
操作 中 的 一 种 . 

对 顺序 算法 而 言 ， 仅 存在 一 个 主 表 ， 每 检查 一 条 关联 边 至 多 只 有 一 个 未 搜索 顶点 加 入 
主 表 中 , Bed 为 顶点 ie 上 的 度数 ， 那 末 搜 索 一 个 图 的 顺序 算法 时 间 上 界 为 


T,=LG@,+)=2m+n 
m 


现在 让 我 们 讨论 在 有 p 个 处 理 器 的 计算 模型 上 ， 并 行 搜索 算法 及 其 时 间 复 杂 性 
ü < psn) 


3.1.2 p 一 深度 优先 搜索 

Ep- 深度 优先 搜索 算法 中 ， 主 表 是 一 个 后 进 先 出 (LIFO) de, HH. —BA 
主 表 选 择 了 一 个 待 搜索 的 顶点 i。 则 与 它 相连 的 至 多 条 边 将 同时 进行 检查 ， 每 个 处 理 器 
将 所 发 现 的 未 被 搜索 过 的 顶点 放 人 自己 的 子 表 中 ， 然 后 把 这 些 子 表 链 接 起 来 并 人 主 表 中 ， 
下 一 次 选择 的 待 搜索 顶点 是 本 次 搜索 到 的 一 个 顶点 ， 若 待 搜索 顶点 所 有 关联 边 均 被 检查 
过 ， 则 从 主 表 中 删除 这 个 项 点， 当主 表 为 空 时 ， 搜 索 过 程 终止 。 
定理 3.1 在 SIMD — CREW PRAM 上 ， 对 一 个 图 G(Y,E) 执行 p— 深度 优先 搜索 的 时 
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间 T,HUR: 

T, < T,( llogpl + 1)/ p+ n( Mogpl +1) 
证 明 ”每 次 搜索 时 ， 所 发 现 的 未 被 搜索 过 的 顶点 总 是 位 于 于 表 中 .将 p 个 处 理 器 的 子 表 
链接 成 一 个 表 需 rlogp1 + 1 时 间 ， 而 检查 一 个 待 搜索 顶 点 ieV 的 所 有 边 ， 需 fd,/ pl 
HIKER, Hp- 深度 优先 搜索 的 时 间 T. 为 


Th = Y fd, / p1 +1) l'logpi +1) 
p 


=5 Td,/ pl (riogm +1) +a( flogpl +1) 


s TH{ Nogpl + 1)/ p+n( rlogpl+ 1) 


3.1.3 P 一 宽 深 优先 搜索 

在 并 行 宽 深 优先 搜索 过 程 中 ， 从 主 表 中 选择 “个 待 搜索 顶点 i。 并 从 主 表 中 删除 这 个 
顶点 。 每 个 处 理 器 至 多 检查 这 个 顶点 的 fa, / 站 + 1 条 关联 边 ， 同 时 把 发 现 未 被 搜索 过 的 
顶点 加 人 自己 的 子 表 中 ， 然 后 将 子 表 链 接 起 来 加 入 主 表 中 ， 下 一 次 搜索 时 ， 选 择 本 次 搜索 
到 的 一 个 未 被 搜索 过 的 顶点 作为 待 搜 索 顶 点 ， 否 则 从 主 表 中 选择 最 后 加 入 的 顶点 作为 待 搜 
索 顶 点 ， 直 到 主 表 为 空 对 ， 搜 索 过 程 终止 。 
定理 32 7ESIMD—CREW PRAM 上 ， 对 一 个 图 G(V,E) 执行 p 一 宽 深 优先 搜索 的 时 
间 了 ?满足 : 

T? & T, /p+n( Tlogpl +3) 

证 明 ”每 次 搜索 时 ， 检 查 待 搜 索 顶 点 iey 的 关联 边 需 1d, / p1 + 1 时间， 然后 将 每 个 处 
理 器 子 表 链 接 起 来 结合 到 主 表 中 需 Id, / pl + 1 时间， 故 p 一 宽 深 优先 搜索 的 时 间 T^ 为 


T = Y(Id,/ p V4 flogpl+1) 


pn 
«»( fd, / p+ llogpt + 3) 
int 


<T,/p+n( llogpl + 3) 


3.1.4 p 一 宽度 优先 搜索 

Ep- 宽度 优先 搜索 过 程 中 ， 主 表 是 一 个 先进 先 出 (FIFO) 的 队列 .一 县 从 主 表 
中 选择 了 -个 待 搜索 顶点 1, RUE ; 从 主 表 中 删除， 然后 p 个 处 理 器 检查 ; 的 一 些 关联 边 ， 
并 把 发 现 的 未 被 搜索 过 的 顶点 放 人 子 表 中 ; 下 一 次 搜索 仍 从 主 表 中 选择 待 搜索 顶点 ， 直 到 
主 表 空 时 ， 才 把 子 表 链 搂 起 来 放 人 主 表 中 。 当 所 有 子 表 链 接 后 仍 为 空 时 ， 出 搜索 过 程 结 
R 
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局 前 面 两 种 并 行 搜索 技术 相 比 ， 并 行 宽度 优先 需要 更 少 链接 结合 步 。 因 为 处 理 器 在 进 
行 搜索 树 的 第 (! + D 层 之 前 ， 已 检查 过 (搜索 过 ) 前 1 层 的 所 有 顶点 ， 这 样 ， 搜 索 树 的 每 
层 仅 需 一 个 结合 步 (1 <i<n—1). 
定理 33 XE SIMD — CREW PRAM 上 ， 对 一 个 图 G(V,E) 执行 p— 宽度 优先 搜索 的 
BRIT) 满足: 

T) &T,/ pL. llogpl + 2n 

这 里 工 是 指 从 开始 项 点 到 最 远 顶 点 的 距离 . 
证 明 ”因为 搜索 图 的 每 层 以 后 ， 链 接 结合 步 需要 {logp1 + 1 时间， 每 个 顶点 的 关联 边 
检查 需要 Id / p1 + 工时 间 ， 整 个 图 从 始点 开始 搜索 有 过 层 ， 则 p 一 宽度 优先 搜索 的 时 


BT, 


T= XI, / pl 1) +L( l'logpl +1) 


<È fd, / pl +L» llogpl + 2n 


p 


€T, /pcrL* llogpl 2n 


(c) 两 个 处 理 器 的 一 宽 深 优先 搜索 (d) 两 个 处 理 器 的 p 一 宽度 优先 搜索 


图 3.1 图 的 并 行 搜索 


3.1 示 出 了 上 述 三 种 并 行 搜索 过 程 ， 其 中 括 导 里 的 数字 表示 遍历 的 次 序 ， 虚 线 表示 
所 搜索 到 的 项 点 已 被 搜索 过 、 
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32 ”图 的 分 布 式 搜索 


在 异步 通信 的 通信 网 络 上 ， 研 究 图 的 搜索 技术 具有 重要 意义 。 因 为 网 络 适 信 的 异步 
性 ， 每 个 网 络 结 点 只 知道 与 它 邻 接 的 结 点 这 一 局 部 信息 ， 要 了 和 解 网 络 全 萄 ， 就 必须 通过 向 
网 络 发 送 消息 ， 对 网 络 进行 搜索 ， 这 样 ， 通 过 应 答 消息 才能 知道 网 络 的 情况 ， 如 网 络 中 的 
结 点 数目 、 网 络 的 连通 性 等 。 本 节 将 介绍 纯 遍 历 搜索 算法 、 分 布 式 深度 优先 搜索 算法 以 及 
分 布 式 宽度 优先 搜索 算法 . 


324 纯 遍历 搜索 (Pure Traversal Searching) 算 法 


L 算法 的 基本 原理 中 

首先 ， 起 始 结 点 sev 进行 初始 化 工作 ， 然 后 s 向 它 的 邻接 结 点 发 送 访问 消 
息 VISIT。 当 一 个 结 点 vey 首次 收 到 VISIT 消息 ， 把 发 送 者 当 作 自己 的 父 结 点 F(v); 车 
一 个 已 访问 过 的 结 点 收 到 VISIT 消息 ， 就 给 发 送 者 一 个 ACK 应 答 消息 同时， 若 ，" 除 
连接 父 结 点 外 还 有 其 它 的 关联 边 ， 则 向 这 些 关联 边 发 送 VISIT WB. By 没有 其 它 的 关 
联 边 ， 则 向 父 结 点 送 回 RETURN 应 答 消息 。 当 一 个 结 点 收 到 所 有 的 应 答 身 不 是 根 结 
点 (起 始点 ) 时 ， 则 向 父 结 点 送 回 RETURN 消息 ， 当 根 结 点 收 到 所 有 应 答 消息 后 ， 向 
所 有 儿子 结 点 发 送 TERM 消息 .终止 算法 的 执行 .一 个 结 点 收 到 TERM 消息 ， 若 非 叶 
结 点 ， 则 向 儿子 结 点 传送 TERM 消息 ， 终 止 算法 执行 ; 若是 叶 结 点 ， 则 算法 终止 ， 
2. 算法 的 形式 化 描述 


Sit 3.1 PURE TRAVERSAL SEARCHING 
MA: BPR v 的 邻居 集 Nv) — ful(uv)eZ} ; 
输出 : 以 起 始点 s ARMPERA RB, EDERAL EFOAILFE KRESONS(). 
begin 
LIEN 的 算法 : 
初始 化 : 
F(s)—s; SONS(j)e-0; 
for each veN(s) do / * 起 动 算法 执行 * / 
send VISIT message to v 
endfor ; 
upon receiving VISIT message from y do: 
send ACK message tov; /A/* 对 消息 发 遂 者 的 应 答 * / 
upon receiving RETURN message or ACK message from all veN(s) do: 
send TERM message to v; 
stop itself algorithmic execution ; 
upon receivmg RETURN message from y do: 
SONS(s)< SONS(s)U{v}; / * MHRA s 的 儿子 集合 * / 
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一 般 结 点 v( 天 5 的 算法 : 
初始 化 : 
F()—0; SONS()-06; 
upon receiving VISIT message from u de: 
if F(y) 0 /A* 第 一 次 收 到 VISIT 信 息 * / 
then F(y)eu; 
N() NW) — fut ; 
if N(v) Ah then send VISIT message to all weN(v) 
else send RETURN message to F(v) 
endif 
else send ACK message to u 
endif ; 
upon reccivmg RETURN message from u do: 
SONS(») &- SONS(v)uíul ; 
if receiving RETURN message or ACK message from all weN(v) 
then send RETURN to F(v) 
endif ; 
upon receiving ACK message from u do: 
if receiving RETURN or ACK message from all weN(v) 
then send RETURN message to F(v) 
endif ; 
upon receiving TERM message from u do: 
if SONS() 关中 
then send TERM message to all weSONS(y) 
endif ; 
stop executing algorithm 
end. 


定理 3.4 ”在 异步 通信 的 分 布 式 计算 模型 上 ， 无 向 连通 图 G(V,E)，|V| = n，|E|= m 的 纯 
遍历 搜索 算法 3.1 需要 的 通信 复杂 性 为 O(m)， 时 间 复杂 性 为 OQ). 

ER ”由 于 每 条 边 至 多 有 两 个 方向 相 皮 的 VISIT 消息 以 及 这 两 个 消息 对 应 的 应 
答 RETURN 消息 或 ACK 消息 ， 故 通信 复杂 性 为 4m = O(m)、 设 从 起 始点 到 最 远 距离 的 
结 点 间 长 度 为 工 ， 则 时 间 复 杂 性 为 O(L) = O(n). 


322 ”深度 优先 搜索 算法 


1， 算 法 的 基本 原理 
Cheung 曾 建 议 了 第 一 个 分 布 式 深度 优先 搜索 算法 ， 算 法 的 基本 思想 是 : 假定 是 最 
新 标号 的 结 点 ， 立 邯 搜 索 与 相 邻 的 一 个 未 标 导 的 结 点 "， 然 后 ， 被 标号 ， 搜 索 将 从 v 开 
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始 进行 ， 若 不 存在 未 标号 结 点 "， 则 搜索 返回 到 w (这 里 u 是 从 w 搜索 时 得 到 的 ) 。 
2， 算法 的 形式 化 描述 


算法 3.2 DISTRIBUTED DFS 
输入 : 每 个 结 点 hyEF (AUR N() = (uluv)eEl : 
输出 : 根 为 起 始点 的 DFS 树 ， 每 个 结 点 "有 父亲 FO) vey. 
begin 
BR Ks 的 算法 : 
初始 化 : 
F(s)e5; 
E(s)e- N(; 
send (label; s) message to v, for onc ve £(s) ; 
一 般 结 点 的 算法 (位 于 结 点 了 ) : 
upon receiving (label; d) from dispatcher d do: 
if r has not been labeled 
then F(r)e- d; label r as F(r); E(r)e Nir) — {d}; 
if E(r)zo 
then send (label; r) to v, for one veE(r) 
else send (echo; r) to 7(r) 
endif 
else send (echo; r) to d 
endif ; 
upon receiving (echo; d) from dispatcher d do: 
E(r) - E(r) — fd}; 
if Er} +b 
then send (label; r) to v, for one ye E(r) 
else if r#s 
then send ( echo; r) to F(r) 
else the algorlithm terminates 
endif 
endif 
end. 


3， 算 法 的 正确 性 证 明 
为 了 证 明 分 布 式 算法 实际 上 做 的 同 它 应 该 完成 的 功能 一 样 ， 是 一 项 困难 的 工作 - 下 
面 我 们 非 形式 化 证 明 算 法 3.2 的 正确 性 ， 
引 理 3.1 MERA s 开始 ， 图 的 每 个 顶点 都 被 标号 且 仅 标号 一 次 . 
证 明 ”因为 结 点 s 首先 被 标号 ， 然 后 s 向 N(s) 中 所 有 顶点 发 标号 消息 ， 叉 因为 图 是 连通 
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仅 当 未 标号 时 才 被 标号 ， 所 以 每 个 结 点 只 标号 了 一 次 ， 

引 理 3.2 ”算法 3.2 最 终 会 终止 。 

证 明 ”显然 每 个 标号 消息 最 终 将 由 应 答 消息 响应 ， 因 此 ， 最 终 E(s) 将 变 成 空 集合 ， 算 法 
将 在 结 点 s 处 终止 ， 而 且 也 仅 在 此 结 点 终止. 

定理 3.5 ”分 布 式 深度 优先 搜索 算法 3.2 能 正确 地 完成 搜索 。 

证 明 ”我 们 将 证 明 深度 优先 搜索 的 两 个 独特 性 质 ，1) 每 个 结 点 " 的 邻接 点 是 一 个 接着 一 
个 的 标号 后 被 搜索 的 。 在 算法 中 ， 每 次 " 发 布 标号 消息 仅 给 一 个 邻接 点 ，r 发 布 标号 消息 
给 另 一 个 邻接 点 仅 当 收 到 第 一 个 标号 消息 的 应 答 后 。2) 搜索 过 程 开始 应 用 于 FU) 的 另 一 
个 儿子 仅 当 目前 的 儿子 r 以 及 它 的 所 有 子孙 都 已 搜索 过 。 算 法 也 正 是 这 样 做 的 。 

4， 算法 的 复杂 性 分 析 

定理 3.6 ”在 异步 通信 的 分 布 式 计算 模型 上 ， 对 图 GUAE), WV] as E= m 执行 深度 优 
先 搜索 的 算法 3.2 需要 的 通信 复杂 人 性 和 时 间 复杂 性 均 为 O(m). 

证 明 ”算法 的 通信 复杂 性 是 指 在 算法 执行 期 间 标 号 消息 数目 与 应 答 消 息 数目 之 和 和， 在 鲜 
个 结 点 r， 应 答 集 合 EQ) 可 作 这 两 个 数 的 计数 器 ， 因 此 ， 算 法 通信 复杂 性 为 了 IE(7)| 


= O(m)， 又 因 迪 历 是 顺序 的 ， 故 时 间 复杂 性 为 Om) 

算法 3.2 的 时 间 复 杂 攻 较 高 ， 这 主要 是 对 所 有 边 顺 序 人 遍历 的 缘故 . Awerbuch 改进 了 
这 一 个 算法 ， 使 得 在 通信 复杂 性 不 变 的 情况 下 ， 时 间 复 杂 性 降 至 O(n)”， 下 面 我 们 介绍 
这 一 改进 算法 , 


3.2.3 ”改进 的 深度 优先 搜索 算法 
l. SARE 

1985 年 Awerbuch 对 算法 3.2 作 了 改进 ， 改 进 后 的 算法 基本 上 与 算法 32 一 样 ， 不 同 
的 是 对 回 边 〈 从 搜索 结 点 到 一 个 已 标号 结 点 之 间 的 边 ) 的 处 理 方法 有 所 差别 ， 即 对 回 边 执 
行 并 行 沉 历 。 这样， 只 在 树 边 上 进行 顺序 遍历 ， 使 得 时 间 复 杂 人 性 减 到 O(n). 

算法 执行 如 下 : 当 一 个 结 点 收 到 DISCOVER 消息 ， 那 么 这 个 结 点 是 第 一 次 被 访问 ， 
它 成 为 搜索 的 活动 中 心 ， 消 息 的 发 送 者 就 成 了 它 的 父 结 点 。 这 个 结 点 发 送 VISITED 消息 
到 除 父 结 点 外 的 所 有 其 它 邻 接 结 点 。 若 除 父 结 点 外 没有 其 它 邻 接 结 点 ， 则 向 父 结 点 送 
Bl RETURN 应 答 消息 ， 当 一 个 结 点 收 到 VISITED 消息 ， 它 知道 消息 的 发 送 者 已 被 访问 
过 ， 从 自己 邻接 结 点 集合 中 删除 发 送 者 ， 表 示 不 再 访问 发 送 者 ， 然 后 送 回 一 个 ACK 消息 
的 应 答 。 当 发 送 VISITED 消息 的 结 点 收 到 所 有 邻接 结 点 的 应 答 后 ， 活 动 中 心 发 送 一 
^ RETURN 消息 给 自己 ， 当 一 个 结 点 收 到 RETURN 消息 ， 那 么 搜索 将 从 此 结 点 开始 。 
也 就 是 说 ， 若 存在 一 个 未 访问 的 邻接 结 点 ，DISCOVER 消息 将 发 送 给 它 ， 这 个 邻接 结 点 
将 标记 访问 过 ; GR, RETURN 消息 将 返回 到 父 结 点 ， 
2， 算法 的 形式 化 描述 


算法 3.3 IMPROVED DISTRIBUTED DFS 
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HEP ANERE: 
DISCOVER: 到 达 一 个 未 被 访问 过 的 结 点 的 消息 ; 
RETURN: 将 活动 中 心 返回 到 一 个 已 访问 过 的 结 点 的 消息 ; 
VISITED: 第 一 次 被 访问 的 结 点 发 送 的 消息 ; 
ACK: 对 VISTTED 消 息 的 响应 ， 一 各 应答 消 息 。 
结 点 了 含有 的 变量 有 
Neighbour(D): && i 的 邻接 结 点 集合 ， 也 是 算法 的 输入 ; 
Father(i; Æ DFS 树 中 ， 结 点 工 的 父 结 点 ， 也 是 算法 的 输出 ， 根 了 的 Father(s)=s; 
Unvisited(): Neighbour( 的 子 集合 ， 它 由 尚未 收 到 VISITED 信 息 的 邻接 结 点 组 成 - 
初始 化 时 ，Unvisited(D = Neighbour(i) ; 
flag (vj 一 个 二 元 标志 ， 在 i 向 /送出 VISITED 之 后 。 j 送 回 ACK 应 答 之 前 ， 
flag(i,j )=1， 初 值 flag(i,j )=0; 
begin 
根 结 点 s 的 算法 : 
初始 化 : 
Father(s) — s ; 
Unvisited(s) — Neighbour(i) ; 
send DISCOVER message to itself ; 
RRB e i( 8) e e e: 
Father(i)e-0; ^ Unvisited(i) +- Neighbour(i ) ; 
结 点 d 的 算法 : 
upon receiving DISCOVER message from j do: 
/ *i is visited for the first time* / 
Father()) e- j ; 
if Neighbour(i) # {7} 
then send VISITED message to g, for all qeNeighbour(i) — {j} 
else send RETURN messege to j / * jis the only neighbour of i * / 
endif ; 
upon receiving RETURN message from 9 do: 
/ * the search is resumed from node i which was already visited in the past* / 
if Unvisited(i) + b ^ 
then send DISCOVER message to k, for one keUnvisited(i) ; 
Unvisited(i) — Unvisited(i) — {k} 
else / * all the neighbour were visited * / 
if Father() Zi / *i isn't node of root* / 
then send RETURN message to Father(i) / * backtracking * / 
else stop, the algorithm has terminated 
endif 
endif ; 
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upon receiving VISITED message from k do: 
Unvisited(i) +- Unvisitd(i) — {k} ; 
send ACK message to k; 
upon receiving ACK message from j do: 
flag L,/)<- 0; 
if flag(i,g)=0 for all geNeighbour{i) then send RETURN to itself endif 
end. 


3. WAM ED HT 
定理 3.7 ”在 异步 通信 的 分 布 式 计算 模型 上 ， 算 法 3.3 计算 图 G(V,E) 的 DFS 树 所 需 的 
通信 复杂 性 为 0(m)， 时 间 复 杂 性 为 C(m)， 
证 明 ”不 难 证 明 ， 当 活动 中 心 到 达 某 个 结 点 时 ， 这 个 结 点 准确 地 知道 到 目前 为 止 ， 它 的 
那些 邻接 结 点 已 访问 过 . 因此，DISCOVER 决 不 会 送 到 回 边 上 ， 这 也 是 节省 时 间 的 原 
A. 注意 在 每 条 树 边 上 ， 仅 有 两 个 方向 相反 的 消息 DISCOVER 及 RETURN 传送 ， 而 
且 ， 每 个 结 点 向 它 的 每 个 邻接 结 点 ( 除 父 结 点 外 ) 发 送 VISITED 消息 ， 每 个 VISITED 
消息 有 一 个 响应 消息 ACK。 因 此 ， 整 个 算法 的 通信 复杂 性 为 Am = O(m), AS, RAM 
边 顺 序 的 遍历 ， 故 时 间 复 杂 性 为 O(n). 

值得 注意 的 是 : 分 布 式 深度 优先 搜索 的 研究 一 直 受 到 广泛 的 重视 ，1987 
年 Lakshmanan 等 人 进一步 改进 了 算法 3.3， 他 们 的 算法 的 通信 复杂 性 为 Am — (n — 1), 
时 间 复杂 性 为 2n 2。 该 算法 的 时 间 复杂 性 是 最 优 的 "。 


3.2.4 ”宽度 优先 搜索 算法 
1， 算法 的 基本 原理 

1983 年 Cheung 建议 的 分 布 式 宽度 优先 搜索 算法 ”的 基本 思想 是 :假定 结 点 4 已 标号 
但 还 未 扫描 过 ， 为 了 扫描 zx， 先 给 4 的 所 有 未 标号 的 邻接 结 点 标号 ， 在 扫描 之 后 立即 扫 
描 标 过 号 的 结 点 - 

算法 开始 于 起 始 结 点 se V. s 发 送 层 号 0 到 所 有 邻接 结 点 。 一 般 来 讲 ， 当 一 个 结 点 了 
收 到 一 个 层 号 1 消息， 它 将 1 与 自己 的 层 号 !，( 初 始 值 为 o) 进行 比较 . 30-1210. RÍ 
ERL 否则 用 I+ 1 FH, War MRS i+ | 发送 到 所 有 邻接 结 点 。 在 算法 终止 时 ， 
ARs 的 最 短路 径 为 1 的 结 点 得 到 一 个 层 号 1,. 
2. 算法 的 形式 化 描述 


算法 3.4 DISTRIBUTED BFS 
RA: 每 个 结 点 veV 的 邻接 结 点 集合 N(7); 
输出 : 一 个 根 为 s 的 BFS 树 ， 每 个 树 结 点 y 有 艾 结 点 F(v)， 层 号 1,， 以 及 儿子 集 
SONS(Y). 
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begin 
BER s 的 初始 化 算法 : 
1 —0; E(s)eN(); SONS()eN(); F(s)e-s; 
send (label; Lh, 5) to v, for all ve E(s); 
一 般 结 点 As) 的 初始 化 算法 : 
1 —o; SONS()-05; F(r)-0; 
在 结 点 r 处 的 算法 : 
upon receiving (label; /, d) from sender d do: 
ifi #0 / +r is labeled * / 
then if i+ 1</, 
then send (delete ; 1, —À, r) tov ,for veF(r); 
Fayed; loltl; E(e-NG)-Íd; 
if F(r)zo 
then SONS(r) — E(r) ; 
` send (label; 7+1, r) to v ,for all ve E(r) 
else send (echo; /, r) to d 


endif 
else send (delete; /, r) to d 
endif 
ele Fl ed; Ilr)eltl; EO NG {d}; 
if E(r)¥ 中 


then SONS(r) — E(r) ; 
send( label; ¿+ 1, r) to v, for ali ve E(r) 
else send (echo; l, r) to d 
endif 
endif ; 
upon receiving (echo; l, d) from sender d do: 
if (41) then wait 
else E(r)  E(r) — {d}; 
if (E(r) 2) A (r=) then. The algorithm terminates endif ; 
if (E(r) = d) A (r #5) then send( echo ; D —lr)to Fr) 
endif ; 
if E(r) X then wait endif 
endif ; 
upon receiving (delete; /, d) from sender d do: 
if AL / + this state takes care of the case that r has now been 
updated with a lower layer number and is no longer the father of d* / 
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then wait 
else E(r) — E(r) — {d}; 
SONS(r)  SONS(r) — {d}; 
if E(r) ^ then send (echo; L —1, r) to F(r) 
else wait 
endif 


end. 


3. 算法 的 复杂 性 分 析 
对 算法 3.4 的 复杂 性 分 析 比 较 困难 ， 这 是 因为 算法 的 通信 复杂 人 性 依赖 于 结 点 所 在 的 层 

号 被 修改 的 次 数 ， 而 层 号 修改 次 数 又 依赖 于 网 络 的 拓扑 结构 以 及 检查 邻接 结 点 的 次 序 。 

故我 们 只 能 给 出 在 最 坏 情况 下 算法 的 复杂 人 性， 

定理 3.8 ”在 异步 通信 的 分 布 式 计算 模型 上 ， 对 图 G(V,E)，|Y| 二 执行 宽度 优先 搜索 的 

算法 3.4 需 要 的 通信 复杂 性 为 O0) WARREN Om) 

证 明 ” 设 在 这 种 异步 通信 网 络 上 对 一 个 含 = 个 结 点 的 完全 有 向 图 GC LE) 进行 宽度 优先 


搜索 。 在 最 坏 情况 下 ， 起 始点 s 只 标号 一 次 ， 而 其 它 结 点 共 标号 了 们 1 一 n(n 07/2. 


一 个 结 点 每 次 标 导 后 都 要 发 送出 n 一 2 个 标号 消息 (s 除外 ， 它 发 出 n 一 1 个 标号 消息 )。 
每 个 标号 消息 将 由 应 答 消 息 或 删除 消息 响应 。 因 此 整个 算法 的 通信 复杂 性 为 
2(n — 1) + 21 — a(n —1)/2= O(n’) 

假定 一 个 消息 在 一 条 通信 和 链 上 传送 时 间 至 多 为 一 个 常量 <， 那 么 ， 在 算法 开始 时 ， 根 结 
点 s 首先 得 到 正确 标号 ; 在 第 c + 1 个 时 间 间 隔 ， 将 至 少 有 另 一 个 结 点 得 到 正确 标号 ; 在 
第 2c + 1 个 时 间 间 隔 ， 将 至 少 又 有 一 个 结 点 得 到 正确 标号 ，…， 故 在 第 nc + 1 个 时 间 间 
隔 ， 所 有 结 点 都 得 到 正确 标号 .所 以 算法 的 时 间 复 杂 性 为 O(n). 

分 布 式 宽度 优先 搜索 算法 3.4 尽管 时 间 复杂 性 已 达到 最 优 ， 但 通信 开销 太 高 ， 在 分 布 
式 处 理 过 程 中 ， 这 两 者 之 闻 存 在 着 一 种 动态 的 平衡 。 下 面 我 们 将 介绍 一 个 通信 及 时 间 复 


REIA O(n”) 的 分 布 式 宽度 优先 搜索 算法 . 


3.2.5 改进 的 宽度 优先 搜索 算法 

Zhu 等 人 基于 分 布 式 系统 中 通信 复杂 性 与 时 间 复杂 性 之 问 存在 着 某 种 平衡 关系 ， 他 
们 建议 了 一 个 通信 复杂 性 和 时 间 复杂 性 均 为 O(n ) 的 BFS WA 
1， 算 法 的 基本 原理 

算法 的 主要 思想 是 ，BFS 树 是 一 层 一 晨 的 创建 起 来 的 。 事 实 上 ， 算 法 是 由 多 次 循环 构 
成 的 每 次 循环 构造 了 BFS 树 新 的 一 层 ， 一 般 说 来 ， 每 次 循环 又 分 为 两 个 阶段 :第 一 险 
段 为 标号 阶段 ， 第 二 阶段 为 应 答 阶 段 ， 在 标 呈 阶段， 开始 从 根 结 点 * 出 发 ， 沿 树 边 遍 历 至 
树叶 结 点 ， 叶 结 点 广播 LABEL 消息 到 那些 未 访问 过 的 邻接 结 点 ， 目 的 在 于 创建 另 一 个 结 
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点 层 ， 这 样 就 结束 了 第 一 阶段 ， 在 应 答 阶段 : 始 于 这 些 新 的 树叶 结 点 ， 它 们 送 回 ECHO 
消息 沿 树 边 抵达 根 结 点 ， 这 样 就 终止 了 这 次 循环 ， 然 后 根 结 点 根据 接收 的 消息 决定 是 否 还 
进行 下 一 次 循环 .。 

2， 算 法 的 形式 化 描述 


算法 3.5 IMPROVED DISTRIBUTED BFS 
输入 : BPS v HARES AEA Neighbour(v): 
输出 ; 一 个 根 在 s 的 BFS 衬 ， 其 中 每 个 结 点 ， 有 父 结 点 Father(y) 及 层 号 Levelly) 以 及 
UF Sons(v)F HARE, 


算法 用 到 的 消息 类 型 : 

INIT: REBAR A. IEEE; 

LABEL( k, lev): 35,5 k iE Sel de hA LEES, BERR ev +15 

ECHO (k, Status) #Ak 送出 的 响应 消息 ， 通 过 扩展 BFS 树 的 可 能 性 消息 由 状态 

参数 的 三 种 可 能 值 表达 . 

(a) ‘keepon’ : Hk ki 继续 给 结 点 kk 发 标号 消息 ， 因 为 大 OEP A BA 
号 ; 
(b) 'stop' : 结 点 i 停止 向 钻 点 发 标号 消息 ， 因 为 大 不 可 能 是 1 的 一 个 儿子 ; 
(c) ‘end’ : 结 点 天 是 扩展 的 末端 ， 因 为 它 没有 未 标号 的 邻接 结 点 ， 

Ri 的 局 部 变量 : 

Neighbour(i) : 结 点 i 的 邻接 结 点 集合 ; 

Labeled(i): 逻辑 变量 ， 当 且 仅 当 i 被 标号 后 其 值 为 “ 真 ”; 

Father(i): 在 BFS 树 中 结 点 i MRA. REAM LH AROS: 

Level(): 在 BFS 树 中 ， 结 点 了 的 层 号 ; 

Unvisiteds() : Neighbour 们 的 一 个 于 集 ， 结 志 革 应 向 这 些 邻 接 结 点 发 送 标号 消息 ; 

Sons(i): 在 BFS 树 中 结 点 i 的 儿子 集合 ; 

Echoed(j) : ZARE, S44 i 也 向 结 点 发送 了 一 个 标号 信息 但 尚未 从 j 收 到 应 

答 消息 时 值 为 “ 假 "。 


begin 

很 结 点 8 的 初始 化 算法 : 

Labcled(s) — false ; 

send INIT to itself; 

一 般 结 点 1 的 初始 化 算法 : 

Labcled(i) — faise ; 

AEE i BEG Hak: 

upon receiving INIT message do: 
Labeled(i)e-true; Father(i)e i; Leveli)—0; 
Unvisited(i) — Neighbour(i);  Sons(i)e à; 


—38— 


if Unvisited(i) 关中 

them send LABEL(i, Level(j)) message to j, for all j eUnvisited(i) ; 
Echoed(7) +- false 

else the algorithm terminated 

endif ; 

upon receiving LABEL(k, lev) from sender k do: 

if Labeled(i) 

then if Father(i) = k 


then send LABEL(i, Level(i)) to j, for all ; eUnvisited(i) ; 


Echoed(j) — false 
else send ECHO(i, ‘stop’ ) to node k 
endif 


else Labeled(i)« true ; Unvisited(i) - Neighbour(i) — fk ; Sons(i) - 6; 


i£ Unvisited(i) = > 
then send ECHO(i, ‘end’ ) to Father(i) 
else send ECHO(i, ‘keepon’ ) to Father(#) 
endif 
endif ; 
upon receiving ECHO(k, Status) message from sender k do: 
Echoed(k) +- true ; 
if Status -- 'keepon' then Sons(i) «- Sons( U{k} 
else if status = ‘stop’ 
then Unvisited(i) — Unvisited(i) — fk] 
endif 
endif; 
if Status= ‘end’ 
then Sons(i) — Sons(?) U{k}; 
Unvisited(i) — Unvisited(i) — {k} 
endif ; 
if Unvisited(i) 4 p 
then if Echoed(j): for all je Unvisited(i) 
then if Father(i)=i 
then send LABEL(i, Level(i)) to j, for all j; 
Echoed(j) < false 
else send ECHO, ‘keepon’ ) to Father(i) 
endif 
else skip 
endif 
ele if Father(i)4i 
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then send ECHO(i, ‘end’ ) to Father(i) 
else The algorithm terminated 
endif 
endif 
end. 


3. 算法 的 正确 性 证 阴 

引 理 3.3 ”在 算法 3.5 终止 时 ， 每 个 结 点 都 给 予 了 标号 ， 且 每 个 结 点 有 唯一 的 父 结 点 ， 根 
是 自己 的 父 结 点 ， 这 意味 着 算法 的 输出 是 一 柠 BFS 树 . 

证 明 ”对 根 结 点 s 来 讲 ， 它 标 号 自己 且 置 其 父 结 点 就 是 自己 。 对 任何 一 个 结 点 IQ S). 
车 它 没 有 标号 ， 则 它 总 是 其 邻接 结 点 中 一 个 末 标 号 的 邻接 结 点 ， 由 于 图 G(V,E) 是 连通 
的 ， 且 每 一 个 标号 结 点 都 试图 给 未 标号 的 邻接 结 点 标号 ， 所 以 结 点 i 最终 至 少 收 到 一 
^t LABEL 消息 并 获得 一 个 父 结 点 ， 此 外 ， 只 有 接收 到 LABEL 消息 才 赋 予 其 父 结 点 ， 在 
整个 算法 执行 过 程 中 ， 每 个 结 点 也 仅 执行 一 次 赋予 自己 父 结 点 的 操作 ， 帮 每 个 结 点 至 多 
只 有 一 个 父 结 点 。 

引 理 3.4 算法 3.5 最 终 将 终止 。 

证 明 ”根据 观察 : 每 个 结 点 将 被 标号 ， 且 每 个 标号 结 点 ”对 LABEL 消息 的 响应 是 : 若 
消息 的 发 送 者 是 非 父 的 邻接 结 点 ， 则 ， 用 ECHO(y,，'stop”) 响应 ; 若 发 送 者 是 父 结 
Hb v 最 终 用 ECHO(i, ‘end’ ) 消息 响应 这样， 在 一 个 结 点 内 ， 每 个 LABEL 消息 都 由 
状态 为 stop 或 end 的 应 答 消息 响应 ， 这 使 得 Unvisited(y) 集合 最 终 成 为 空 集合 .特别 是 
在 根 结 点 * 处 ， 这 导致 整个 算法 的 完成 . 

4. 算法 的 复杂 性 分 析 

定理 3.9 ”在 异步 通信 的 分 布 式 计算 模型 上 ， 对 无 向 连通 图 G(V LE) 执行 宽度 优先 搜索 的 
算法 3.5， 所 需 的 通信 复杂 性 和 时 间 复 杂 性 均 为 O(n”). 

证 明 ”因为 算法 3.5 是 由 许多 次 循环 组 成 的 . 设 第 i 次 循环 时 ， 已 构成 的 BFS RES n, + 
铺 点 Gn, <n), SEPIA RBH r (Er, <n,)， 叶 结 点 度数 之 和 为 m (1 € m, <m), 
Bid «d, < n)。 则 在 第 一 阶段 ， 衬 根 发 送 LABEL 消息 至 树叶 的 消息 数 为 Ofn,)， 
所 衡 的 时 间 为 0(4,)。 由 叶 发 LABEL 消息 到 根 收 到 应 答 的 消息 数 为 (m, 一 +,)， 时 间 
AO). 在 第 二 阶段 ， 消 息 返 回 根 的 通信 复杂 性 为 CO(m, en). HARRY Old, 
十 优 。 故 整个 算法 的 通信 复杂 性 为 


Lem, +n, =r) s Zelm, *0)- O(dn) £k cYm, = O(n” +m) = O(n’) 
这 里 。>0 常数 ，4 为 从 s 出 发 到 达 最 远 结 点 的 最 短路 径 (4 <) 算法 的 时 间 复 杂 性 为 
‘ 2 
Yd, +1)= “(2S d+ a)< 2c'(4* d) O(a) = O(n") 


d RERA 
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3.3 小 结 


本 章 重 点 讨论 了 在 并 行 及 分 布 式 环境 中 对 图 进行 遍历 搜索 的 各 种 搜索 算法 .。 基 
于 SIMD - CREW PRAM, S47 p — 深度 优先 、p 一 宽度 优先 以 及 p — 宽 深 优先 的 
搜索 算法 并 分 析 了 它们 的 计算 复杂 性 ， 其 中 p 是 处 理 器 数目 (p < wn)， 基 于 异步 通信 的 分 
布 式 计算 模型 ， 本 章 给 出 了 纯 遍 历 搜索 算法 、DFS 搜索 算法 以 及 改进 的 DFS 搜索 算法 . 
最 后 还 介绍 了 两 个 BFS 搜索 算法 ， 这 两 个 算法 各 有 特色 ， 前 者 虽然 具有 最 优 的 时 间 复 杂 
性 ， 但 通信 复杂 性 差 ; 后 者 使 通信 复杂 性 有 所 改善 ， 但 以 花费 额外 时 间 为 代价 ， 本 章 介 
绍 的 几 种 搜索 技术 是 后 面 许多 图 论 算法 要 用 到 的 基本 技术 . 

由 于 深度 优先 搜索 本 身 固有 的 顺序 性 只 ， 到 目前 为 止 ， 对 一 般 图 GU/,E) 进行 深度 优 
先 搜索 ， 尚 未 发 现 一 个 时 间 为 0{iog“n)， 处 理 器 数 为 OOY 的 并 行 算法 ， 其 中 e 为 大 于 
FHER S0) 为 n 的 一 个 非 零 多 项 式 ， 因 此 这 是 一 个 仍 未 解决 的 问题 ， 但 Smith 基 
于 SIMD 一 CREW PRAM， 对 平面 图 给 出 了 第 一 个 深度 优先 搜索 的 并 行 算法 。 他 的 算 
法 需 O(log n) 时 间 和 O(n) 处 理 器 由。 最 近 He 等 人 对 Smith 算法 进行 了 改进 ， 基 
于 SIMD -CREW PRAM， 建 议 了 一 个 简单 的 深度 优先 搜索 并 行 算法 ， 他 们 的 算法 执 
行 时 间 为 O(log n)， 仅 需 O(n) 43828. Kim 等 人 基于 SIMD — CREW PRAM， 运 用 
了 求 最 短路 径 的 并 行 算法 ， 对 无 环 有 向 图 给 出 了 一 个 O(log n) 时 间 和 O (n^ / logn) 个 处 
理 器 的 深度 优先 搜索 的 并 行 算法 只 

在 图 的 宽度 优先 搜索 的 并 行 算法 中 、 大 部 分 算法 都 是 基于 求 图 的 最 短路 径 。 
在 SIMD - CREW PRAM 上 ,已 有 的 宽度 优先 搜索 的 并 行 算法 的 时 间 复 杂 性 
为 O0og n)、 处 理 器 数目 复杂 性 为 Oln’ / logn)" ， 因 后 面 我 们 还 要 介绍 求 最 短路 径 的 
并 行 算法 ， 故 宽度 优先 搜索 的 其 它 并 行 算法 本 章 不 再 介绍 。 

值得 一 提 的 是 : 在 过 去 的 几 年 里 ， 人 们 一 直 很 重视 分 布 式 BFS 算法 的 研究 ，1985 
年 Awerbuch 使 用 了 一 种 在 异步 环境 中 模拟 同步 环境 算法 的 同步 器 (Synchronizer) 技术 ， 
给 出 了 一 个 通信 复杂 性 为 Oln) RAREN O(log n) 的 分 布 式 BFS 算法 (1 <k 
<n)", Frederickson 考虑 了 稀 草 图 这 一 特殊 情况 下 的 BFS 算法 ， 建 议 了 一 个 通信 和 时 
间 复 杂 性 均 为 O(nm) WR RIM, Awerbuch 等 曾 独立 地 建议 了 算 
法 3.5， 利 用 分 块 (Partitioning) 方法 ， 在 每 个 块 之 间 执 行 算法 3.5， 最 后 得 到 一 个 通信 复 
杂 性 为 0((m + n )logm)， 时 间 复杂 性 为 Ofn logn) 的 分 布 式 算法 。 还 进一步 指出 ， 若 
过 程 递归 调用 ， 则 分 布 式 BFS 算法 的 期 望 通信 复杂 性 为 Oon2 7779 y, 时 间 复 杂 
O(n AP eae BFS 算法 较 这 里 介绍 的 算法 复杂 得 多 ， 故 未 曾 介绍 ， 
有 兴趣 的 读者 可 去 参阅 有 头 文献， 最 近 作者 利用 算法 3.5 的 思想 ， 在 分 布 式 计算 模型 上 ， 
对 二 分 图 最 大 基数 匹配 问题 建议 了 一 个 通信 复杂 人 性 为 O0r "(n^ em). 时 间 复 杂 性 
3] 0077) I 
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第 四 章 求 连通 分 支 的 并 行 算法 


寻找 无 向 图 连通 分 支 是 近 十 几 年 来 并 行 图 论 算法 研究 领域 一 个 最 活跃 的 分 支 。 无 向 图 
G(P, 司 的 一 个 连通 分 支 是 G 的 一 个 最 大 连通 子 图 ， 在 这 个 子 图 中 任意 两 个 顶点 之 间 都 有 
TARE. RE G 的 所 有 连通 分 支 称 之 为 找 连通 分 支 算法 目前 在 并 行 环境 中 ， 求 图 的 
连通 分 支 有 三 种 方法 。 第 一 种 是 采用 某 种 形式 的 搜索 技术 ， 如 BFS 等 ; 第 二 种 是 通过 图 
的 邻接 矩阵 计算 图 的 传递 闲 包 ; 最 后 一 种 是 Hirschberg 提出 的 顶点 倒塌 (Vertex 
Collapse) 法 . 本章 仅 介绍 后 两 种 方法 ， 尤 其 是 最 后 一 种 方法 在 各 种 并 行 计算 模 型 上 的 实 
3t. 


4.1 传递 闭 包 法 


Reghbati RA” 曾 建议 了 用 图 G 的 自 反 传 递 闭 包 求 图 的 连通 分 支 ， 他 们 的 算法 将 描 
WET. 约定 G(V,E) 的 邻接 矩阵 是 4，4 的 自 反 传递 闭 包 是 8， 那么 B 的 元 素 定义 如 
F: 

1, 顶点 ;与 顶点 /之 间 有 路 径 存 在 ; 


5 = ly mm. 
第 三 个 矩阵 C BURSA B 构造 出 来 的 ，C MCR RMF: 
Jo bak 
fu 7 G. TW. 


同时 还 约定 每 个 连通 分 支 有 相同 的 标识 ， 我 们 把 每 个 连通 分 支 中 最 小 标号 顶点 的 标号 作 
为 它 所 在 连通 分 支 的 标识 ， 设 顶点 ie V 的 连通 分 支 标识 为 DO. 

很 据 自 反 传递 闲 包 定义 B= (4 + 7)"， 其 中 了 为 单位 矩阵 ， 符 号 “十 ”定义 为 丈 辑 
加 ， 则 求 连通 分 支 的 详细 算法 形式 化 描述 如 下 : 


算法 4.1 CONNECTED — COMPONENTS USING TRANSITIVE — CLOSURE 
procedure Connected__Components (G,V,£) ; 
begin 
(1) for each i, f:15i, j Sn pardo / * #73840" / 
D()ci; 
b,J) - ai,/) 
endfor ; 
for l-1 to flogn1 do / * FR 2ER flogn1 次 */ 
(2) for each i, j,k:1<i,j,k<n pardo /* 计 算 B* / 
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eG, 7, R= BG, RABE, J); 
bü, N= Vell 7, E) 


kl 
endfor 
endfor ; 
(3) for cach i, /:1&i, 7 <n pardo /* 计 算 C*/ 
if 5(i,j) — 1 then c(i j) j 
else c(i,j)« œ 
endif 
endfor ; 
(4) for each i:1 «ix pardo / * 求 连通 分 支 标识 */ 
for cach j:1x j €n pardo 
DD emin {cli,j) | cfi, j) # cot 
endfor 
eudfor 
end. 


518 4.1. 在 SIMD -CREW PRAM E. it4E—^ n ERM ARRAN 4.1 
$ Olog n) 时 间 和 O(n”) 处 理 器 。 

证 明 ”和 矩阵 4 MAREE B — (A 十 刀 "， 故 中 的 计算 可 变 成 计算 (4 +I) (4 
+D, (AEDS, s D 7 这 一 序列 求 得 。 也 即 对 (4 + D HEFT Togn KERR 
乘 求 得 ， 由 第 (2) 步 可 知 : 两 个 矩阵 相 乘 ， 著 用 n^ 个 处 理 器 ， 则 可 在 O(logn) 时 间 完 成 ， 


所 以 求 一 个 矩阵 的 自 反 传递 闭 包 需 O log" n) 时 间 和 O(n”) 处 理 器 . 
定理 4.1 在 SIMD — CREW PRAM |, HARAR G(V. E) |V|— n 的 连通 分 支 的 


算法 4.1 需 O(log^n) 时 间 和 O(n ) 处 理 器 。 

证 明 ”从 算法 4.1 可 知 ; 算法 的 第 (0)，(3) 步 均 需 0(1) 时 间 和 O(n”) 处 理 器 ; 算法 的 
第 (2) 步 需 Olog n) 时 间 和 O(n”) 处 理 器 ; 算法 的 第 (4) 步 需 O(logn) 时 间 和 O(n") 处 理 
器 。 故 整个 算法 需 O(log”n) 时 间 和 O(n”) 处 理 器 ， 


图 4.1 例 示 了 此 算法 大 概 的 执行 过 程 ; 
a | 1 2 3 4 5 6$ 7 8 
1 1 1 0 0 0 o 9 0 
s © 2 1 1 o 0 0 0 9 0 
Q o@ © 3 0 0 1 1 0 0 0 0 
(7) 4 0 0 1 1 0 0 o 0 
@) 5 | 0 1 0 0 i 0 1 0 
O O 6 | o 0 0 0 0 1 o 0 
7 o 1 0 0 1 0 i o 
a | 0 0 0 1 0 o 0 1 


B|1 23 4 $ 6 7 8 Cj! 2 3.4 5 6 7 8 MA | 连通 分 支 标识 
i|: o: 0 0 0 0 0) 0 111 2 9 e $ c T c 0]oad 
2101100 1010 2j|1 2 c o $ c 7 æ 2 1 
3/0 0 1 1 0 0 O0 1 3c o) 3 4 co o» co g 3 3 
410 0 ij 1 0 0 0 1 4 |co 0 3 4 oo o oo k 4 3 
$1100 10 10 $|1 2 c c $ c 7 æ 5 1 
sjo o 00010290 6 |o» œ æ æ c» 6 æ oo 6 6 
7|] 1 @ 0 1 0 10 7|1 2 9 c S5 c 7 æ 1 i 
s/o 0 1 1 0 0 0 1 8|o œ 3 4 c» c æ 8 8 3 


图 41 利用 传递 闭 包 寻 找 连通 分 支 
值得 一 提 的 是 : Kucera 基于 SIMD — CRCW PRAM， 建 议 了 一 个 用 自 反 传递 闲 包 求 
连通 分 支 算法 "。 他 的 算法 的 关键 点 是 : 使 用 O(n?) 处 理 器 在 常量 时 间 内 求 出 = 个 元 素 的 
最 小 值 ， 具 体 做 法 如 下 : 
假定 我 们 要 找 CS. cp = c, 这 个 元 家 的 最 小 值 ， 使 用 n^ 个 处 理 器 ， 处 理 器 编号 
采用 阵列 形式 ， 约 定 PE， 表示 编号 为 (i,j) 处 的 处 理 器 。 个 临时 变量 为 1，1,，…, +,。 


算法 4.2 MINIMUM OF n ELEMENTS 
begin 
(1) TAAL, PE, Et 864080; 
(2) 车 cj < LE PEE, = 1， 在 这 一 步 结 未 时 ， 1, 708 BRS 
c, 7 minfc,, c, 6, 
/ 这 时 可 能 存在 多 个 最 小 值 ， 第 3 步 仅 一 个 处 理 器 返回 最 小 值 * / 
(3) 著 与 一 0 i<j, MPE, Xt, 一 1， 此 刻 仅 一 个 临时 变量 的 值 为 0; 
(4) 3 1, — 0, PE 返回 ci 值 作为 最 小 值 


end. 


求 最 小 值 算法 4.2 可 用 来 求 最 大 值 和 布尔 矩阵 的 乘法 运算 ， 例 如 ， 设 布尔 矩阵 A, B 
WERE C, Me, o maxía, Ab s au Abas  @,Ab,,} EAA no 个 处 理 


PIT 
器 在 OQ) 时 间 内 完成 <i, j <n). 故 在 使 用 ”处理 器 时 计算 矩阵 C 可 在 O(1) 时 间 
内 完成 。 

定理 4.2 在 SIMD — CRCW PRAM 上 ， 求 无 向 图 G(V,E), IV1 一 n 的 所 有 连通 分 支 的 
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算法 4.1 Œ Odogn) 时 间 和 O(n") 处 理 器 . 

证 明 ”执行 一 次 矩阵 乘法 运算 需 0(1) 时 间 和 O(n') 处 理 器 ， 而 由 图 的 邻接 矩阵 计算 自 反 
传递 闭 包 需 执行 logn1 次 矩阵 乘法 运算 ， 由 算法 4.1 可 知 在 SIMD -- CRCW PRAM 上 
计算 无 向 图 连通 分 支 需 O(logn) 时 间 和 O(n") 处 理 器 . 


42 顶点 倒塌 法 


4.2.1 算法 的 基本 原理 


Hirschberg 首先 提出 用 顶点 倒塌 法 求 图 的 连通 分 支 "”。 算法 的 输入 是 邻接 甜 阵 4. 
为 标记 每 一 个 连通 分 支 ， 将 每 个 连通 分 支 内 最 小 标号 顶点 E 为 该 连通 分 支 标 
识 , 约 E dev. HOO 表示 i 所 在 的 连 道 分 支 标识 .算法 结束 时 ， 具 有 相同 连通 分 支 标 
识 的 顶点 位 于 同一 连通 分 支 内 .算法 的 基本 轧 想 是 : 每 个 顶点 仅 是 一 个 超 顶 
点 (Supervertex) 的 成 员 ， 而 每 个 超 顶 点 都 是 由 最 小 标号 顶点 标识 ， 这 个 顶点 叫做 “ 根 ”。 
算法 开始 时 ， 每 个 顶点 都 是 它 自己 这 个 超 顶 点 的 很 。 并 行 算法 是 由 一 系列 循环 完成 的 。 而 
每 次 循环 又 分 为 三 步 : 第 一 步 ， 发 现 每 个 顶点 的 最 小 标号 邻接 超 顶 点 ， 第 二 步 ， 把 每 个 趋 
顶点 的 根 连 到 最 小 标号 邻接 起 顶点 的 根 上 ; 第 三 步 ， 所 有 在 第 二 步 连接 在 一 起 的 超 顶 点 倒 
塌 成 一 个 较 大 的 超 顶 点 。 因 为 超 顶 点 的 个 数 每 次 德 环 后 至 少 泪 少 一 半 ， 所 以 把 每 个 连通 分 
支 倒塌 成 为 单个 超 顶 点 至 多 rlogn1 次 循环 即 可 . 


4.2.2 算法 的 形式 化 描述 


算法 43 CONNECTED — COMPONENTS USING COLLAPSE VERTICES 
输入 : ARBUERERA; 
输出 : 向 量 D(1: n)， 其 中 DD() 表 示 顶 点 1 的 标识 。 
begin 
(1) for each i: 1 <ign pardo /* 初 类 化 */ 
D()c-i 
endfor ; 
de step (2) through step (6) [logy] iterations 
(2) for cach i, /:l & i, j <n pardo / * 找 邻接 顶点 中 的 最 小 超 顶 点 * / 
Ce min(b() | AG, j) 2 1 and DO DOUX; 


if none then C(i) — D(i) endif 
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endfor ; 


G) for each í j:1<1, j <n pado / * 求 每 个 超 顶点 的 最 小 邻接 超 顶点 * / 
C- min (C() | D) =i and CU) «i; 
if none thea C(i)~ D(i) endif 

endfor ; 

(4) for cach i: 1s in pardo 
D()« CQ) 

endfor ; 

(5) for [logn] iterations da / * 找 每 个 顶点 新 的 超 顶 点 * 

for cach 1:1 <i<n pardo 
CD -CC 

endfor 

endfor ; 

(6) for each i: 1 «in pardo 
D(i) - min (C()), D(C) 
endfor 
end. 


423 算法 的 正确 性 证 明 

在 给 出 算法 的 正确 性 证 明之 前 ， 首 先 我 们 引入 一 个 称 为 k 树 环 估 一 tee 一 loop) 的 概 
fS 一 个 有 向 图 是 一 个 kM > 0) 当 且 仅 当 它 的 每 个 顶点 的 出 度 都 为 1， 且 在 此 图 中 存 
在 唯一 的 一 个 长 度 为 kH 的 有 向 回路 .注意 一 个 大 一 树 环 至 少 含有 kH 个 顶点 。 

树 环 是 指 对 某 个 kik > 0) 的 上 一 树 环 .在 天 =0 这 一 特殊 情况 下 ， 我 们 定义 0 一 B 
环 的 根 为 一 个 顶点 "， 它 是 由 一 条 边 (vv) 组 成 ， 长 度 为 1 的 有 向 回路 . 一 个 俱 乐 
部 (Club) 是 一 个 0 一 树 环 ， 在 此 树 环 中 所 有 边 都 指向 根 项 点 ， 图 4.2 说 明了 这 几 个 定 


X. 
) 
€ 
© © © 


9-83 COUR BBD 
其 中 1 为 根 


图 42 kB 
引 理 4.2 $ G, -(V,, E)JEG(V, EVW-TFEBDXE VY | 22, EXT 
Be: vo v.s XB c(i) =min{j| A(i,j)=1 and j il. BA 定义 了 一 个 有 向 
HG (c) - (V, , E^), BEE’ ={<i,cW)>lieV,}, BAG (c) 是 由 许多 1 一 树 环 组 成 
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的 ， 而 且 在 每 个 树 环 中 最 小 标 导 顶 点 位 于 树 环 的 有 向 回路 上 。 
证 明 ”根据 c 函数 的 定义 ，G (c) REAM. HF cla) i KE (0) 中 不 存在 0 一 
SR, BG (c) 存在 一 个 上 一 IIR 做 > 0)。 令 vuv um ry 表示 一 树 环 中 的 有 向 回 
B Peo, =v p i50, 1, k-1, HR c(v,)m v). A X — M th. Sy, 
=minfv vv, MHEG (e) P. v. v, WE v, 是 邻接 顶点 且 e(v) v, v. Bk 
> 1 时， 这 与 前 提 矛 盾 ， 故 G,(c) 中 仅 存 在 1 一 BR. BREH v, v, 组 成 有 向 回 
Sev.) v, e(v) m vu. 类 似 地 我 们 可 以 证 明 料 环 上 最 小 标号 顶点 也 必须 在 树 环 的 有 向 
回路 上 ， 

根据 < BCE, FIRMA BR ot AEX. V, >V, 

n c(v), k=1 
d el e(c* (y, k»1 

51843 4 v& GLO 的 任意 一 个 树 环 顶 点 ， 且 令 办 v ea ERROR E PA DE 
Ae WBA, MENS 2, MWR oy) 这 两 个 数 中 的 一 个 等 于 Ww， TERT AMET v 
证 明 ”因为 从 v 到 达 v Rv, 顶点 的 较 近 一 个 的 距离 至 多 为 n 一 2， 故 由 这 一 事实 ， 上 述 
命题 不 难得 证 ， 

有 了 上 述 的 诸 定 义 及 引 理 ， 现 给 出 算法 的 正确 性 证 明 ， 
定理 4.3 算法 4.3 根据 输入 的 对 称 邻接 矩阵 4 可 计算 出 无 向 图 GV EY BERE ORAE XE. 
证 明 ”对 一 个 孤立 顶点 的 平凡 图 ， 算 法 显然 能 计算 出 它 的 连通 分 支 ， 下 面 我 们 证 明 V] 
关 2 时 ， 算 法 也 能 给 出 所 有 的 连通 分 支 . 4 G(D) = (V. E,) 是 由 函数 D 定义 的 一 个 有 向 
A. HE, ={ <i, DG)>lieV}. CATR (DES. 98 (2) 步 之 前 ，G(D) 满 
足下 列 一 些 性 质 : 

(1) GD) BRAS 

(I) 每 个 俱乐部 的 根 是 该 俱乐部 的 最 小 标号 顶点 ; 

(I) 任何 一 个 俱乐部 的 顶点 集 都 是 某 个 连通 分 支 顶点 集 的 一 个 子 集 . 
RASEN: 车 在 执行 第 2) 步 之 前 G(D) 满 足 性 质 ( 工 )-( 王 ) ， 那 么 在 执行 第 (2)-(6) 步 之 后 ， 
新 的 函数 D( 第 (@) 步 计算 的 ) 导 出 的 图 G(D) 也 有 性 质 (I )-( 于 ) ， 此 外 ， 若 在 执行 第 (2) 步 之 
前 ， 每 个 连通 分 支 内 吾 少 有 两 个 俱乐部 ， 则 循环 后 俱乐部 的 个 数 至 少 减少 一 半 。 

首先 我 们 注意 第 (D) 次 执行 第 (2) - (6) 步 的 情形 。 开 始 时 D 是 一 个 单位 函数 ， 第 (2) 
PAR c 的 定义 同 引 理 4.2 的 定义 一 致 ， 故 建立 G 的 每 个 连通 分 支 的 19 树 环 ; 第 (3) 
步 c 没有 改变 ， 因 为 改变 仅 当 D(j) =i Heiti 在 第 (4) 步 ， 函 数 ce BAB D: 而 在 
第 (5) 步 ,c Btw c", 这 里 入 一 2 ”第 (6) 步 置 D0) 为 minfe"(D),D(e”(i)} SH 
FE DG) A miníc" (i), c" ()).. 83138 4. 可 知 ， 对 所 有 lev, DG) 等 于 包含 i 的 树 环 
的 最 小 标号 顶点 ， 这 样 每 个 树 环 的 顶点 集 已 归并 到 一 个 俱乐部 中 ， 故 执行 第 1 次 循环 
后 ，G(D) 仍 满 足 性 质 (1) — (M). ARARA 1 一 树 环 至 少 会 有 两 个 顶点 ， 在 每 个 非 平凡 
的 连通 分 支 中 ， 它 的 俱乐部 数目 不 超过 它 原来 数目 的 一 半 ， 


Vo vey, 
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正如 前 面 已 提 到 的 ， 进 一 步 的 循环 将 是 归并 超 顶 点 〈 即 俱乐部 ) ， 超 顶点 间 连 接 定义 
如 下 : A V, 指定 为 G(D) 中 所 有 俱乐部 的 根 的 集合 。 令 G, =, E ) 是 一 个 无 向 图 ， 
ERIS]. Qu Jel, 当 且 仅 当 在 ，， Ry, 所 在 的 俱乐部 分 别 存在 两 个 成 员 顶 
点 vv BO, 1k, 换 句 话说 ， 两 个 超 顶 点 互 为 邻接 超 顶 点 当 且 仅 当 存在 一 条 
连接 它们 成 员 顶 点 的 边 ， KA 。 在 第 (2) 步 和 第 (3) 步 建立 。 在 第 (2) 步 ， 每 个 硕 点 i 审查 
它 的 邻接 项 点 的 俱乐部 成 员 资格 ， 且 置 c(i) 为 最 小 标号 的 邻接 俱乐部 标识 。 在 第 (3) 步 ， 
每 个 ieV, 审查 自已 的 俱乐部 成员 (由 DU) = LEGE) ， 并 从 它 所 在 俱乐部 成 员 发 现 的 最 
小 标号 俱乐部 中 挑选 出 一 个 最 小 的 标号 俱乐部 标识 自己 。 简 单 地 讲 ， 函 数 y o v, E 
这 样 的 一 个 函数 ， 对 所 有 Ie V. c) 等 于 在 G， 中 与 关联 的 最 小 标号 的 邻接 顶点 ， 正 
如 引 理 4.2 所 说 ，c 在 G 上 定义 了 许多 1 一 BER. EPIRA e V, ITUR Uk 
样 的 顶点 ， 不 存在 满足 DU) = ;的 了 ， 因 而 在 第 (3) 步 cli) EROS DU, Wiley ov 
在 G 上 定义 了 许多 1 一 树 环 。 因 为 每 个 非 根 顶 点 都 指向 根 ， 而 根 是 1— 树 环 ， 因 而 在 执 
行 第 (6) 步 之 后 ， 新 的 函数 D 导出 的 GORED). wah AER 1 一 树 环 
BFC, 中 两 个 或 多 个 顶点 ， 即 两 个 或 多 个 俱乐部 。 因 而 在 至 少 含有 两 个 俱乐部 的 连通 分 
支 内 ， 俱 乐 部 数目 至 少 减少 一 半 。 

由 上 述 讨论 可 知 ， 在 每 个 连通 分 支 仅 由 一 个 俱 东 部 组 成 之 前 ， 每 次 循环 都 使 得 俱 乐 
部 数目 至 少 喊 半 。 不 难 证 明 ， 随 后 的 循环 都 不 影响 单个 俱乐部 ， 又 由 于 算法 开始 时 ， 每 
个 连通 分 支 至 多 有 n 个 顶点 (俱乐部) ， 故 经 过 Nog n1 次 循环 足以 把 每 个 连通 分 支 帮 
归并 到 单个 俱乐部 内 。 定义 了 俱乐部 的 成 员 ， 


424 算法 的 复杂 性 分 析 
在 分 析 算法 的 复杂 性 之 前 ， 先 将 算法 4.3 的 第 (2) 步 进一步 细 化 。 设 Temp(1:n; 1:n) 
为 一 个 临时 数组 ，Index( 为 一 个 下 标 变量 。 第 (2) 步 细 化 如 下 : 
(2a) for cach i,j: 1& ijj <n pardo 
if (4(,i) = DADY + D) 
then Temp (i,j) ~ D(/) 
eke Temp(i,j) — co 
endif 
endfor ; 
(2b) for k«-0 to [logs] — 1 do 
for cach i, j:1 «i, j <n pardo 
if (j +2") mod (1 +1) 40 
then Index(i)« (j +2") mod (n 4-1) 
else Index(i) — 1 
endif ; 
Temp(i,j) — min(Temp(i, j), Temp (i, Index(/))] 
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endfor 
endfor ; 
(2c) for cach i : 1x i n pardo 
if Temp(i, 1) = œ then C() -— D(i) else C(i)— Temp(i, 1) endif 


endfor ; 


连通 分 支 1 23 458 7 8 
建立 新 的 超 顶 点 
选 代 1 Q © © 
寻找 有 最低 邻接 超 顶 点 连接 超 顶 点 的 根 SOD Oz 
CRON O-Q OG 
HOODY COW Ba 
4 6 
GO O-O 连通 分 支 1012 3 2 2 2 2 
选 代 2 
s E RH 顶点 建立 新 的 起 顶点 
OFO, 
Qe 
ODF NEO Go 
Z OW 
O 


WR 1234567 
Pada 


图 43 顶点 倒塌 法 求 连通 分 支 
从 第 (2) 步 细 化 可 以 看 出 ， 实 现 此 步 需 O(n^) 处 理 器 和 O(log^n) 时间. 
定理 4.4 在 SIMD — CREW PRAM 上 ， 求 无 向 图 G(V,E), iV| — 的 所 有 连通 分 支 的 
SEE 4.3 88 O(log’ n) 时 间 和 O(n") 处 理 器 ， 
证 明 ”从 算法 4.3 我 们 可 以 看 到 : 算法 的 第 0) 步 、 第 (4) 步 以 及 第 (6) 步 均 可 在 O(D 时 
间 内 完成 ， 若 使 用 个 处 理 器 ; 算 法 的 第 (3) 步 同 第 (2) 步 一 样 地 实现 ,这 两 步 
均 需 O(logn) 时 间 和 O(n”) 处 理 器 ; 又 第 (2)、(6) 步 需 rlogn1 次 循环 , 故 整 个 算法 
需 O(log n) 时 间 和 O(n”) 处 理 器 . 
推论 4.1 在 SIMD- CREW PRAM 上 ， 求 无 向 图 G(V,E) 的 所 有 连通 分 支 需 O(log n) 
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时 间 和 O(n” / logn) 处 理 器 。 
证 明 ”因为 对 a 个 元 素 求 最 小 值 可 采用 分 组 技术 .使 用 O(n / logs) 处 理 器 时 ， 每 个 处 理 
器 最 多 分 到 logn1 个 元 素 .每 个 处 理 器 首先 计算 自己 的 最 小 值 ， 这 需要 O(logn) 时 间 ， 
然后 这 O(n / logn) 个 处 理 器 并 行 的 从 各 自 的 最 小 值 中 选 出 全 体 元 素 的 最 小 值 ， 这 一 步 需 
要 log( In/logn!)< lloga—logloga! 时 间 ， 所 以 从 个 元 素 中 选取 最 小 值 只 篇 
要 O(logn) 时 间 和 O(n /logn) 处 理 器 ; 把 这 种 技术 应 用 到 算法 的 各 步 ， 不 难 推 得 算法 
88 O(log^n) 时 间 和 O(n” / logn) 处 理 器 . 

43 表示 顶 卡 倒塌 算法 的 执行 过 程 。 


43 最 优 的 连通 分 支 算法 


Chin 等 人 在 研究 算法 4.3 的 基础 上 ， 基 于 同一 计算 模型 给 出 了 一 个 改进 算法 B4， 改 进 后 的 
算法 是 一 个 最 优 算法 ， 他 们 的 算法 同 项 点 个 塌 算 法 43 的 不 同 之 处 在 于 : 在 每 次 循环 的 归并 过 
程 中 ， 仅 限于 对 超 顶 点 进行 操作 ， 而 不 再 对 已 被 好 并 的 超 顶点 以 及 孤立 的 超 顶 点 进行 操作 ， 这 
也 是 减少 使 用 处 理 器 的 原因 ， 为 此 他 们 在 算法 中 引入 了 一 个 长 度 为 4 的 flag 向 量 以 及 清扫 步 

{算法 的 第 0)，(8) 步 ) 来 标识 超 顶 点 以 便 及 时 地 清扫 那些 已 被 归并 的 超 预 点 和 那些 已 成 为 孤立 
的 超 顶 点 。 其 中 : flag()= 1 表示 顶点 i 是 超 顶 点 ，flag(=0 表 示 顶 点 i 已 归并 到 某 个 超 顶 点 或 i 
是 一 个 孤立 超 顶 点 。 在 算法 的 其 后 循环 过 程 中 ，8agky=0 的 顶点 i 将 不 再 考虑 。 他 们 算法 的 形 
式 化 描述 如 下 : 


算法 44 OPTIMAL CONNECTED—COMPONENTS ALGORITHM 
输入 : n BARRE A: 
输出 : QE Din) XP DG) 表示 顶点 i 的 连通 分 支 标识 ， 它 等 于 i 所 在 连通 分 
支 的 最 小 标号 顶点 标识 。 


begin 
(1) for each i:1«ixn pardo / * 初始 化 */ 
Dijei; flag(i) —1 
endfor; 


do step (2) throrgh step (8) Tlog n? iterations 
(2) Qa) for each i: 1xixn pardo / * RHEBAWARS* / 
Se {i | lagi) = 1} 
endfor ; 
(2b) for each i,j: i, jes pardo / * 找 每 个 超 顶点 的 邻接 顶点 “7 
c(i) e mint] MG )- 1 


if none then c(i)«-i endif 
endfor ; 
(3) for each i:ieS pardo 


—51— 


if c(i)= i them flag(). O endif / + BIG GENE + / 


endfor ; 
(4) for cach i: ie S pardo 
D()« efi) 
endfor ; 


(5) for llogn! iterations do / * 求 每 个 超 顶 点 的 顶点 标识 / 
for cach i:ieS pardo 


€)  c(c()) 


endfor 
endfor ; 


(6) (62) for each i:ieS pardo 
D(i) — minfc(), D(c()] 


endfor ; 


(6b) for each i:1xisn pardo 
DO D(DG) 


endfor ; 


/* 清扫 步 * / 


(7) (7a) for each i, j: 


(ie S) A eS) (j = DU) pardo 


Alij) ORÍAGE) | Dk) = j} 


endfor ; 


(7b) for cach i,j: (jieS) A Ges) A(G 2 DU) AG- D()) pardo 
Alij ) c OR(ÍAG,D| D(k) = i) 


endfor ; 


(7c) for each i:ieS$ pardo 
Ai )e0 


endfor ; 


(8) for cach i:ieS pardo / * 形成 新 的 超 顶 点 集 + / 
if D(i) £i then flag(/) - 0 endif 


endfor 
end. 


算法 的 正确 性 在 上 面 已 经 给 予 了 证 明 ， 下 面 我 们 只 对 它 的 复杂 性 进行 分 析 。 首 先 我 们 


引入 两 个 引 理 。 


引 理 4.4 ”已 知 个 元 素 的 集合 fa。,a 


x A(n)=a,*a,*a Fok 


2 
意 一 个 二 元 结合 运算 符 ， 且 


Hou 


a, , 可 在 TK) 个 单位 时 间 内 计算 出 来 ， 这 二 


onsa, 1 以 及 KK 个 处 理 器 那么 表达 


* ”是 任 


fn / KI —1+ logk, #ln/2) >K, 
logn, 否则 。 
证 明 Ke Ln/ 21 ， 则 利用 递归 折 杰 (Recursive Doubling) BORE logn 时 间 内 可 
将 4(m) 计算 出 来 . 现 考虑 天 «n / 21 情形 ,我 们 将 faa, 划分 为 六 个 组 ， 除 最 
后 一 组 外 ， 每 组 有 n/K 个 元 素 ， 最 后 一 组 有 + 一 n 一 (K 一 1) fn /KK1 个 元 过 ,每 组 分 
配 一 个 处 理 器 并 计算 各 组 的 部 分 子 积 ， 完 成 这 一 任务 需 In/ K1— 1 个 单位 时 间 ， 结 果 得 
到 天 个 部 分 子 积 。 然 后 玉 个 处 理 器 合作 ， 并 行 计算 个 部 分 子 积 的 乘积 ， 最 后 算 
出 4(m)， 完 成 这 后 面 的 任务 需 logK 时 间 ， 故 一 共 需 时 间 为 Tn / K1— 1+ logK. 
5[3 4.5 7: SIMD—CREW PRAM 上 ， 已 知 有 nk SAE, Al<K<ln/2), 
则 算法 4.4 的 (2) 步 至 多 需要 O(n / K + lognlogk) 时 间 完 成 ， 否 则 只 需要 Oog n) 时 间 
就 可 完成 . 
证 明 ”由 算法 4.4 可知， 车 1< 久 < tn /24 ， 则 每 次 循环 后 超 顶 点 数 至 少 减 少 一 半 ， 央 
每 次 循环 后 |S| 减少 一 半 。 这 样 在 执行 了 1 = loge] 一 logK 次 循环 之 后 ，13| 至 多 为 2K， 
此 得 出 时 间 上 界 TL (n, K) 为 : 


T(n,K) = { 


1 Dept -i 


Tn, K= E CIa/2*] / Ki-14dogK) e. Y, log(n / 2*) 


5, to 
< [2n/ Kl + t logK + (logK) 
X O(n / K + lognlogK) 

BKzla/2, Wr] EAS: 


Hogs! = 1 


T,@,K)= Y log(n/2")= O(log’n) 


类 似 地 可 以 证 明 算法 4.4 的 第 (7) 步 ， 若 使 用 mn 天 个 处 理 器 ， 也 可 在 Titn, KOT ER. 
定理 4.5 在 SIMD — CREW PRAM 上 ， 求 一 无 向 图 G(V,E) 的 连通 分 支 算法 4.4 
需 OUn / k+ log^n) MAM O(nK) AERIS (X > D). JS K —n/ log n 时 ， 这 时 算法 
$8 O(log^n) 时 间 和 O(n? / log’n) 处 理 器 。 

证 明 ”首先 我 们 计算 一 下 每 步 的 执行 时 间 以 及 湖 要 的 处 理 器 数目 。 


步 总 的 计算 时 间 处 理 器 数 
1< K«lnZ21 Kè ln/ 2) 

[o] on) om n 

(2a) Ologn) Olog'n) n 

(2b) O(n/ KHogilogK) O(log'n) aK 

[o] Oogn) Ooga) n 

@ O(logn) Ofogn) a 

6) Olon) Ologn) n 

[2] Ologn) Ologn) n 

[n] O(n/ KHogin) O(logn) aK 

@) Oflogn) Odogn) a 
—53— 


故 整 个 算法 需 O(n / KcHog syl ill O(nK) 处 理 器 . 


44 稀疏 图 的 连通 分 支 算法 


在 前 几 节 介绍 的 算法 对 稠密 项 ( 边 较 多 的 图 ) 来 讲 是 有 效 的 ， 但 对 稀 琶 图 ( 边 较 少 的 
FAM E = O(n)) 未 必 是 好 的 算法 。 为 此 Savage 等 人 对 算法 4.3 进行 了 一 些 修改 ， 给 出 了 
LI ET vr t 

Savage 等 人 的 算法 同 算法 4.3 的 不 同 之 处 普 先 表现 在 算法 的 输入 方面 。 她 们 算法 的 输 
人 是 由 邻接 表 组 成 的 矩阵 玉 ， 只 是 一 个 n x (n — 1) 的 矩 阵 ， 其 中 第 i 行 是 由 顶点 i 的 邻接 
顶点 组 成 的 (1 < i< nn)。 并 且 她 们 还 用 了 一 个 辅助 向 量 EM(1:n)， 这 里 EMG) 是 R 的 第 i 
行 最 后 一 个 元 素 的 下 标 (1 < i n). 对 照 算法 4.3， 当 输入 为 邻接 表 时 ， 观 察 它 是 如 何 执行 
的 ? 下 面 就 讨论 算法 4.3 在 邻接 表 输入 时 的 实现 细节 。 

EL 我 们 可 以 用 EM(i) 个 处 理 器 在 O(1) 时 间 内 找 出 集合 {| AGA) = l= 1j 


TER 的 第 i 行 } 的 所 有 元 素 ， 因 此 算法 43 的 第 (2) 步 可 使 用 OL EM() = O(m) 处 理 器 


在 O(logn) 时 间 内 实现 ， 

算法 4.3 的 第 (3) 步 实现 起 来 似乎 要 难 一 点 ， 因 为 UL DU) 一 让 对 所 有 i 来 讲 似乎 需 
O(n?) 处理 器 ,注意 ， 若 i 不 是 一 个 俱乐部 的 根 ， 那 么 这 一 步 DG) 的 值 没有 改变 ， Hi 
是 根 ， 则 集合 (I DU) = D 是 根 为 i 的 俱乐部 顶点 的 集合 ， 为 减少 处 理 器 数目 ， 她 们 的 算 
法 是 ， 令 是 DD 的 一 个 拷贝 令 I 是 I(i)=i 的 n 元 向 量 (1 <i<n), fl Preparata 的 排 
序 算法 "" 对 B 进行 排序 ， 注 意 在 排序 过 程 中 ， 若 B(i) 与 B(7 ) 交换 了 位 置 ， 则 (A) 也 
5j IG) 交换 位 置 .排序 需 O(logn) 时 间 和 O(nlogn) 处 理 器 ， 这 时 我 们 注意 到 ， 每 个 俱 乐 
部 的 顶点 在 了 中 都 聚 在 一 起 了 ， 不 难看 出 : 在 O(logn) 时 间 内 ， 使 用 O(n) SERB ERT 
以 修改 R 的 一 个 拷贝 R'， 使 得 R' 的 第 # 行 是 由 根 为 的 俱乐部 的 顶点 所 组 成 。 我 们 可 用 
这 个 R' 去 实现 算法 4.3 的 第 (3) 步 。 基 本 方法 同 第 (2) 步 一 致 ， 所 以 第 (3) 步 需 要 O(logn) 
WHEA O(m + nlogn) 处 理 器 . 
定理 4.6 在 SIMD 一 CREW PRAM 上 ， 计 算 一 个 稀 朴 的 无 向 图 G(V,E), |V| 9n, (EI 
=m 的 所 有 连 道 分 支 需 要 O(log’ n) 时 间 和 O(m + nlogn) 处 理 器 。 
证 明 ”根据 上 述 的 分 析 ， 在 算法 4.3 的 每 一 步 实现 过 程 中 ， 最 多 需 OQogn) 时 间 和 Om 
+ nlogn) 处 理 器 ， 而 算法 第 (2) — (6) 步 循环 了 [logn1 次 ， 故 整个 算法 需 O(log n) 时 间 
和 O(n + nlogn) 处 理 器 . 


45 一 维 阵列 上 的 连通 分 支 算法 


到 目前 为 目 ， 我 们 介绍 的 连通 分 支 算法 都 是 基于 理想 的 共享 存 贮 模型 ， 从 本 节 开 
始 ， 在 后 面 的 几 节 将 介绍 基于 互连网 络 模型 的 连通 分 支 算法 。 
计算 无 向 图 连通 分 支 的 一 种 简单 方法 是 : 首先 每 个 顶点 组 成 一 个 集合 ， 其 后 ， 若 存在 
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一 条 边 把 两 个 不 同 集合 的 元 素 联接 起 来 ， 我 们 就 把 这 两 个 集合 归并 为 一 个 新 的 集合 。 当 图 
的 所 有 边 都 已 检查 完毕 后 ， 最 后 剩 下 的 每 个 顶点 集合 对 应 图 的 一 个 连通 分 支 。 

Savage" 建议 使 用 = +1 个 处 理 器 组 成 一 维 线性 心动 (Systolic) 阵列 。 处 理 
器 1，2，…,m， 对 应 顶点 1 …，F。 每 个 处 理 器 上 有 了 两 个 域 : 第 一 个 域 包含 顶点 标号 ; 
第 二 个 域 Comp(i)， 表 示 顶 点 i 的 当前 连通 分 支 标号 ， 初 始 状 态 时 ， 这 两 个 域 的 值 都 
dài. Hin + 1 处理 器 作为 一 个 周转 装置 一 次 只 移 人 图 的 一 条 边 到 第 一 个 处 理 器 。 奇 《 
侦 ) 数 编号 的 处 理 器 在 奇 〈 偶 ) 数 脉冲 时 激活 ， 所 以 每 隔 一 个 脉冲 就 有 一 条 边 进入 心动 阵 
列 ， 边 记录 从 第 一 个 处 理 器 进入 人 遍历 直至 第 + 1 个 处 理 器 ， 然 后 再 从 第 n+ 1 个 处 理 器 
开始 作 反 疝 遍历 返回 到 第 一 个 处 理 器 ， 最 后 离开 心动 阵列 ， 当 处 理 完 最 后 一 条 边 记录 时 ， 
对 任何 ieV. Comp(i) 就 是 i 的 连通 分 支 标号 了 。 

有 移 边 记录 包括 边 (u, v) xy 的 当前 连通 分 支 标号 C，，v, 的 当前 连通 分 支 标 


SC, i 左 移 边 记录 JG (uv). minfC, ,C, Y (用 (C ua, RR) 
EmaxiC, C, Y ACL, Em). 
每 个 处 理 器 i 激活 时 执行 的 算法 如 下 : 


算法 4.5 CONNECTED — COMPONENTS ON LINEAR ARRAY 
procedure Computing in 4i. processor(i) ; 
/*1<ign, ATR, DRE opm. 反之 为 偶数 时 ， 仅 在 偶数 脉冲 
时 执行 ， 存 于 第 i 一 VERE Su, vL C, C, 进入 第 ;个 处 理 器 以 及 存 
于 第 i 十 1 个 处 理 器 的 (x v) Cou? Co ,也 进入 第 i 个 处 理 器 * / 
begin 
if Comp(i) = C 


wer, then Comp(i) — Cus, endif ; 
if u, =i then C, — Comp(i) 
a 
else if v, = j then C, « Comp(j) endif 
" 

endif ; 
if C, -CL, then €, -Ca, endif ; 
if Cu Cu, then c, CCa, endif 


end. 


第 + 1 个 处 理 磊 具有 特殊 用 途 ， 它 的 作用 是 将 边 记 录 返 回 到 心动 阵列 ， 其 程序 为 
procedure Computing last processor ; 

/* 车 十 1 为 奇数 ， 仅 在 奇数 脉冲 时 执行 ， 反 之 在 偶数 脉冲 时 执行 + / 

begin 


if C, «C, then Cos -C ; C -C 
" k n 


Me 
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endif 


图 4.4 例 示 了 此 算法 的 执行 过 程 。 

定理 4.7 ”在 一 维 线性 心动 阵列 上 ， 求 一 无 向 图 GUE ]V| = m. [El o m 的 所 有 连通 分 
支 需 O(m + n) WRA O(z) 处 理 器 。 

证 明 ”因为 图 的 每 条 边 必须 顺序 地 进入 心动 阵列 ， 这 需 O(m) 时 间 ， 而 每 条 边 在 心动 阵列 
中 驻 留 时 间 为 0(n)。 故 算法 需 Olm + n) 时 间 和 O(n) 处 理 器 。 


46 二 维 网 孔 上 的 连通 分 支 算法 


Nassimi 4& A 已 将 算法 4.3 移植 到 网 孔 模 型 上 ， 在 他 们 的 算法 中 ， 许 多 地 方 都 要 
热 行 两 个 重要 子 过 程 ， 分 别称 之 为 RAR({(Random Access. Read) 
X RAW(Random__Access_Write)™, HH RAR 有 两 个 参数 ， 第 一 个 参数 是 接收 数据 
的 地 址 ， 第 二 个 参数 是 一 个 表达 式 ， 表 示 要 读 的 值 。 例 如 在 执行 了 RAR(G)b(cG)) 之 
后 ， 每 个 未 屏蔽 的 处 理 器 让 中 局 部 变量 a() 的 值 等 于 处 理 器 c(i) 中 局 部 变量 b(c(i)) 的 值 . 
过 程 RAW 也 有 两 个 参数 ， 第 一 个 参数 表示 要 写 的 值 ， 第 二 个 参数 是 要 写 的 地 址 。 如 在 执 
FIT RAW(a(i)b(c()) 之 后 ， 每 个 未 屏 项 的 处 理 器 i 中 局 部 变量 al) 的 值 将 写 入 处 理 
ac) 中 局 部 变量 b(c(0)) 所 在 的 单元 中 去 。 若 有 多 个 值 往 同一 地 直 单 元 号 ， 约 定 这 些 值 中 
的 最 小 值 是 最 后 的 结果 值 . 

为 描述 算法 方便 起 见 ， 引 人 函数 BITS，BITS(i, j,k 返回 整数 i (i > 0) 的 二 进 制 表 
示 的 第 了 位 到 大 位 的 值 (0 位 是 最 低位 )、 如 

BITS(17,3,1)=0, ”BITS(10,3.2) = 2, 
BITS(16,4,4)=1, — BITS(152,3) 0. 

已 知 无 向 图 GV, E) A = 2 个 顶点 ， 图 G 的 度数 为 4， 令 adj(i,j) 是 硕 点 1 的 邻接 
表 (1 <ign, 1«j «d) 如 果 顶 点 1 有 4d,(< 4d) 条 关联 边 ， 那么 对 于 d,+1<j<d 
4 H adi(ij)e- 吕 。 每 个 硕 点 的 邻接 表 存 放 在 对 应 编号 处 理 器 的 局 部 存 贮 器 中 。 假定 n 个 处 
理 器 的 二 维 网 孔 采 用 洗 牌 行 主编 号 " 

在 叙述 详细 算法 之 前 ， 我 们 引入 算法 中 变 用 到 的 一 个 过 程 Reduce， 此 过 程 对 应 于 算 
法 4.3 的 第 (5) 步 ， 将 同一 超 顶 点 内 的 所 有 顶点 都 用 根来 标号 。 具 体 细节 如 下 : 

procedure Reduce(D,n) ; 

begin 
for b 1 to [log n] do 
for each i:1<i<a pardo 
if BITSOD(D, logn — 1, b) = BITS(i, logn — 1, b) 
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then RAR(D{i), D(D() 
endif 
endfor 
endfor 
end. 


详细 算法 的 形式 化 描述 如 下 : 


算法 4.6 CONNECTED — COMPONENTS ON MESH ARRAY 
输入 : 每 个 处 理 器 i 存放 着 邻接 表 adji(i,j), I«i«n 1«j «d; 
输出 : 每 个 处 理 器 i 有 一 局 部 变量 D(i)， 它 是 顶点 1 MEERDER. DOFT 
六 所 在 连通 分 支 的 最 小 标号 项 点 (1 S i< a). 
begin 
(D for each i:1<ign pardo / * 初始 化 */ 
D()-i 
endfor ; 
for b«—0 to lloga1 — 1 do 
(2) for each i : 1« i «n pardo 
candidate (i)«— oo 
endfor ; 
(3) for j —1 to d do 
forcxhi:l&i«npmb /* 每 个 项 点 找 邻接 顶点 的 最 小 超 顶 点 * / 
RAR (temp(i), D(adj (i); 
if temp(i) = D(i) then temp(i)< oo endif; 
candidate(i) — min{ candidate(i), temp(i)} 
endfor 
endfor ; 
(4) for each i: 1<i<n pardo / * 找 每 个 超 顶点 的 最 新 超 顶点 * / 
RAW (candidate(i), D(D(1)) ; 
if D(i) oo then D(i)— i endif; 
if D(i)- i then RAR(DU), D(D(i)) endif 
endfor ; ` 
(5 Reduce(D, n) / * 用 新 的 标识 去 标识 每 个 项 点 * / 
endfor 
end. 


在 给 出 算法 复杂 性 之 前 ， 首 先 引 入 一 个 引 理 ， 它 在 分 析 复 杂 性 时 要 用 到 . 
引 理 4.6 “在 "个 处 理 器 组 成 的 二 维 网 孔 上 ， 实 现 过 程 RAR 及 过 程 RAW 和 需 O(Vz ) 时 间 , 
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证 明 ”利用 网 孔 上 排序 算法 即 可 ， 详 细 证 明 见 " . 

定理 4.8 已 知 无 向 图 G(V,E). Jtr Ivi - 2^ =n, 6 的 度数 为 4， 那么 在 个 处 理 器 组 
成 的 二 维 网 孔 上 求 G(V,E) 的 所 有 连通 分 支 算法 4.6 $ O(dnlogn) 时 间 . 

证 明 ”因为 算法 4.6 的 第 (3) 步 需 0(dn) 时 间 ， 而 第 (3) 步 需 执行 rlog nl 次 ， 故 整个 算 
法 需 O(dnlogn) 时 间 和 O (n) 处 理 器 。 


4.7 小 结 


本 章 主要 讨论 了 求解 图 论 的 一 个 基本 问题 一 连通 分 支 的 各 种 并 行 算法 ， 重 点 介绍 
了 传递 闭 包 法 和 顶点 倒塌 法 . 其 中: 基于 SIMD - CREW PRAM & SIMD 
一 CRCW PRAM, 介绍 了 一 个 用 传递 闭 包 法 求 连通 分 支 的 算法 ; 基于 SIMD 
— CREW PRAM， 给 出 了 基本 的 顶点 倒塌 法 及 改进 后 的 最 优 连 通 分 支 算法 ; 还 介绍 了 在 
这 种 计算 模型 上 ， 当 图 以 邻接 表 输入 时 ， 顶 点 倒塌 法 的 实现 细节 ; 最 后 ， 在 一 维 线性 阵列 
和 二 维 网 孔 上 ， 给 出 了 顶点 倒塌 法 的 实现 算法 。 

在 本 章 的 开始 ， 我 们 就 已 经 叙述 过 ， 求 图 的 连通 分 支 是 并 行 图 论 算法 研究 的 热门 课题 
之 一 。 近 些 年 来 ， 关 于 这 一 领域 的 研究 ， 已 经 取得 了 许多 成 果 ， 在 这 里 我 们 试图 对 这 些 成 
果 做 一 个 简单 的 概括 ， 见 表 4.1， 有 兴趣 的 读者 可 以 继续 进行 这 一 领域 的 研究 ， 

在 共享 存 贮 模型 上 ，Savage 等 人 的 结果 ， 是 对 算法 4.3 作 了 某 些 修改 后 得 出 
fü. Nath PA 通过 建立 链 结 构 和 数据 的 多 个 副本 ， 解 决 了 数据 的 “ 读 冲 突 ”， 实 现 了 
算法 43. Shiloach 4 A ^ 和 Vishkin 中 于 1982 年 和 1984 年 的 结果 ， 巧 妙 地 利用 了 顶点 
HUA. Reif SA 则 在 模型 中 引入 随机 性 ， 使 得 “ 写 冲突 ”随机 地 解决 ， 也 就 是 
说 ， 若 i 个 处 理 器 同时 往 某 一 个 共享 存 贮 单元 写 数据 时 ， 则 只 有 一 个 写成 功 ， 究 竟 是 那 一 
个 写成 功 ， 事 先 并 不 知道 ， 完 全 由 生成 的 随机 数 来 决定 .这 样 ， 每 个 处 理 器 写 人 成 功 概率 
是 17 d6«isn. 他 们 的 概率 并 行 算法 分 为 两 个 阶段 。 第 一 个 阶段 是 2loglogn KERK 
随机 执行 阶段 ， 将 顶点 倒塌 为 超 顶 点 的 初始 化 过 程 ， 且 每 次 循环 仅 希 0(1) 时 间 。 在 第 二 
有 阶段 则 执行 Shiloach 等 人 的 算法 .结果 得 到 表 4.1 中 列 出 的 期 妄 时 间 复杂 人 性 和 处 理 器 复 
杂 性 ， 且 执行 时 间 超 过 O(loglog n) 的 概率 为 o(1 / n). Peper " 对 求解 图 的 连通 分 支 问 
题 ， 提 出 一 个 所 谓 的 “灯塔 ” 算法。Kruskal 等 人 中 研究 的 并 行 算法 ， 适 用 于 求 稀 玖 图 的 
连通 分 支 间 题 ， 他 们 为 链表 计数 设计 出 一 个 更 为 有 效 的 算法 ， 利 用 该 算法 得 到 两 种 共享 存 
贮 模 型 上 的 并 行 算法 ， 其 结果 示 于 表 4.1 中 .Han RAD 细致 地 考察 了 顶点 倒塌 法 ， 发 
现 该 法 每 次 循环 选 代 时 ， 只 有 超 顶 点 数 成 几何 级 数 减少 ， 而 边 未 必 能 达到 这 一 点 ， 因 而 这 
种 方法 应 用 到 稀 术 图 上 求 连通 分 支 ， 效 果 并 不 理想 ，1990 年 他 们 提出 了 一 个 在 每 次 循环 时 
弃 考 虑 顶点 归 约 又 考虑 边 归 约 的 连通 分 支 并 行 算法 ， 在 SIMD -CREW PRAM 模型 
上 ,算法 需 O(m/ p+ nlogn / p+ log n) 时 间 和 O(p) MER, 1« p«m/log'n. 而 且 
他 们 还 进一步 提炼 了 该 并 行 算法 得 出 表 4.1 中 的 结果 . 他 们 令 P,(1,k) 
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=o, Pika, WE h (k, a) = minfi | P Gk) > a}, d H(m,n,p) 
=m h (m / n, login / plogp))， 它 非常 接近 于 m. 


表 4.1 求 图 的 连通 分 支 并 行 算法 


7 + 
* 8 时 间 复 妇 性 处 理 器 复杂 性 & & 
1981 | Savage A" | SIMD-CREW PRAM O(logd loga) O(n? / loga) dI EG 
i 
1982 | Nath 等 人 nl | SIMD-EREW PRAM O(log") Ofn*/ loga) 
| Shiloach & 
1982] SIMD-CRCW PRAM O(loga) O(n+2m) 
1 Vishkin!!4 
1982} Reif $A" | SIMD-CRCW PRAM OGogloga) On") 期 望 复 杂 性 
1987) Peper $A" | SIMD-CRCW PRAM O(n) O(n) 
| Gopalakrishnan 
985; SIMD-9- 维 网 孔 Olg(m en! Yoga) O(n) eae 
E 
1979:.— Wylio SIMD 树 机 Oflog?n) O(nt2m) 
1984; Yeh 等 人 四 Systolle 树 机 oun" 7p) ol) le psa 
1987 | Awerbuch $] — SIMD 洗 牌 网 络 Oliog™n) ot) 
1984| Ullmen™! SIMD 树 网 O(log’) On") 
i 
H F 2 
1985) Huang?" SIMD 树 网 O(n / p) o) 1<p% jam 
! 
1980| Van Scoy? 二 维 细胞 阵列 On) O(n") 细胞 处 理 器 
l 
1981] Lipton 等 人 pa | — VLSI WZIAL ota”) Oa") 0<a<1 
i 
p&m,.. 
1986 | Kruskal 等 人 四 | SIMD-EREW PRAM |O(m/ p + niogp/ p 7) Ow) logp&m/n, 
: 0<z<1 
i 
i ^ p&Nm/logn 
1986) Kruskal 等 人 | SIMD-CREW PRAM | OC + lone + plogp) ow) logos m/ n, 
i O<e<l 
i | PULL 1< p< m/ iog'n 
: L4 D 
$990! Han 4: AP" | SIMD-CREW PRAM post) O(p) H (m,n, p) 
i lega ) 非常 接近 mm 
— L. 


余下 连 网 络 模型 上 ，Gopaliakrishnan FA” 基于 4 一 PALEN, XEXORSBLIE IMG 


连通 分 支 ， 提 出 了 一 个 并 行 算法 ，Wyllie™" 则 基于 树 机 模型 应 用 顶点 合 塌方 法 ， 给 出 一 
个 并 行 算法 ， 使 用 一 个 双向 循环 链表 结构 存 贮 每 一 个 顶点 的 邻接 表 ， 其 结果 包 食 在 表 4.1 
H, Yeh 等 人 中 基于 Systolic 树 机 模型 ， 建 议 了 一 个 连通 分 支 并 行 算法 。Awerbuch 85^? 
在 洗 牌 网 络 模型 上 提出 了 相应 的 算法 ，Ulimanpa 则 基于 树 网 这 种 特殊 VLSI 结构， 给 出 
一 个 并 行 地 求 图 的 连通 分 支 算法 。 随 后 ，Huang59 基于 同一 模型 得 到 一 个 更 为 有 效 的 连 
通 分 支 并 行 算法 ，Levitt 等 人 中 和 Van Scoy" 分 别 给 出 二 维 细胞 阵列 上 的 并 行 算法 ， 

表 4.1 列 出 了 后 者 的 结果 .Lipton 等 人 中 和 Hochschild 等 人 外 基于 VLSI fü) — MABE 
型 ， 分 别 建 义 了 求解 图 的 连通 分 支 并 行 算法 。 粱 维 发 和 陈 国 良 在 超 立 方 上 建议 了 最 优 的 
连通 分 支 算法 中 。 
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BLS ”最 小 生成 树 的 并 行 算法 


在 一 个 无 向 连通 的 加 权 图 G(V,E) 中 ， 每 一 条 边 (i,/ ) 都 赋 以 一 个 权 值 wt1,j )， 从 
G 中 找 出 一 村 生 成 树 ， 若 它 的 权 值 和 为 最 小 ， 则 称 这 村 生 成 树 为 图 G 的 一 棵 最 小 生成 
fd (Minimum Spanning Tree)， 简 记 作 MST。 当 图 G 含有 权 值 相等 的 边 时 ， 将 会 有 多 
棵 MST， 为 了 简化 后 面 的 讨论 ， 我 们 约定 G 中 按 的 权 值 都 不 相同 。 事 实 上 ， 若 有 相同 的 
边 ， 则 可 把 三 元 组 (w(i, )，minfi,j Y maxfi,7 }) 的 字典 序 作为 赋 给 每 条 边 的 权 值 ， 其 
中 : wy) 表示 顶点 ;与 顶点 j 之 间 的 边 (i,j ek 的 权 值 。 若 图 G 不 是 连通 的 ， 则 下 面 的 
算法 执行 结果 是 由 多 棵 最 小 生成 树 组 成 的 森林 (最 小 生成 森林 MSF) . 

在 找 G(V,E) 的 MST 算法 中 ， 经 典 的 让 行 算法 有 Solin Be”, Prim — Dijkstra 算 
1k WLR Kruskal 算法 咱 ， 本 章 介绍 的 并 行 算法 ， 基 本 上 都 是 上 述 三 种 算法 的 并 行 化 版 
本 下面 各 节 ， 我 们 将 介绍 找 图 G 的 MST 并 行 算法 . 


5.1 Sollin 算 法 的 并 行 化 


Sollin 算法 并 行 化 是 从 # 个 孤立 顶点 的 森林 开始 ， 每 个 顶点 被 看 作 一 标 树 。 在 一 次 
循环 过 程 中 ， 算 法 同时 (并 行 地 ) 对 森林 中 的 每 一 棵 树 确 定 该 树 中 任 一 给 定 的 顶点 与 某 个 
其 它 树 中 顶点 连接 的 最 小 边 。 除 了 两 襟 树 不 是 用 多 于 一 条 边 连接 的 这 种 情况 外 ， 所 有 这 些 
边 都 被 加 到 森林 里 。 此 循环 过 程 不 断 进行 ， 直 至 森林 中 只 有 一 桔 树 一 一 最 小 生成 树 时 ， 
算法 才 终止 。 因 为 每 次 循环 时 ， 树 的 数目 至 少 减少 一 半 ， 所 以 Solin 算法 并 行 化 至 多 需 
要 [logn1 次 循环 就 可 找 出 最 小 生成 树 . 

在 并 行 环境 里 ， 如 何 标识 一 柑 最 小 生成 树 呢 ? Savage 利用 了 Hirschberg 的 “顶点 
倒塌 法 ”， 也 就 是 司 一 裸 生成 树 的 顶点 都 用 向 一 个 标识 来 标识 。 这 样 ， 每 棵 生成 树 中 最 小 
顶点 的 标识 就 成 为 当前 最 小 生成 树 的 标识 。 每 次 找到 的 一 棵 生成 树 的 最 小 边 就 等 于 在 超 顶 
点 之 间 的 最 小 边 。 

下 面 ， 我 们 非 形 式 化 地 描述 Sollin 算 法 的 并 行 化 : 

开始 时 +=0， 令 G,- GL). WG, REAM G HO a PLATA. 假定 对 某 个 
正 整 数 ! > 9 时 已 构造 成 G,. HG, 是 连通 的 ， 则 G, 是 图 G 的 MST， 算 法 结束 ; 否则 ， 
EG, 中 找 出 每 个 连通 分 支 C, 的 顶点 与 另 一 连通 分 支 C, 的 一 个 顶点 之 间 的 边 ， 它 们 
XC, 与 所 有 其 它 连 通 分 支 的 边 中 权 什 最 小 的 边 ， 将 所 有 这 样 的 边 加 入 G, 中 ， 则 形成 新 
KAG ,， 重 复 这 种 过 程 ， 最 终 可 求 出 图 G 的 MST. 467 是 G, 成 为 MST 时 1 的 最 小 


f£, Rn/2 21, Ble’ < Togn. 
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我 们 把 从 G, AEG, 的 过 程 作为 一 次 循环 ， 则 上 述 算法 在 一 次 循环 时 
48 O(logn) 时 间 和 O(n?) 处 理 器 .其 构造 性 证 明 如 下 : 

归纳 假设 ， 设 (> 0 时 、G , 已 构造 好 ， 图 G 的 每 个 连通 分 支 C 的 最 小 标号 顶点 作 
为 C 的 连通 分 支 标识 ( 超 顶 点 的 根 ) .OTEEISIOD SY 5 V. GUB DG) 表示 顶点 i 在 
第 :次 循环 时 、i 的 连通 分 支 标识 .约定 =O, Di HE, 构造 G,,, 的 过 程 如 
T 


算法 51 PARALLELIZATION OF SOLLIN'S ALGORITHM 

输入 : ANG ih WAAR EE W = (wit 

Mrd GE EGRE GUN, DEAR, 

begin 

(0) 车 DD =D U) 对 所 有 的 iev, jevAUR A. NG RAGH—-RMST, Xi 
终止 ; 

(2) 计算 函数 CIV o V. 对 每 个 顶点 ieV RH. CH=7 545 WHS) 
XD )* D,G' y 5 与 顶点 i 关联 的 边 中 权 值 最 小 的 边 ; 

(3) 对 G ,的 每 个 连通 分 支 C， 我 出 C 内 的 某 个 顶点 i Ewi Ci MERD. W 
图 G 中 所 有 这 样 的 边 加 入 G ,中 构成 为 G,，，，; 

(4) REG ,的 每 个 连通 分 支 的 连通 分 支 标识 。 计 算 串 数 D,， SVO V. D 
所 在 连通 分 支 的 标识 


GEI 


ES 


end. 


定理 5.1 在 SIMD — CREW PRAM 上 ， 求 一 无 向 连通 加 权 图 G(V,E), IVi=n 
的 MST， 算 法 5.1 需 O(og?m) 时 间 和 O(n”) 处 理 器 。 
证 明 ”首先 我 们 证 明 ， 算 法 5. 的 每 一 循环 步 均 需 O(logn) 时 间 、O(n”) 处 理 器 。 由 G， 
构造 G，， 这 一 步 可 知 (注意 G, 不 连通 ) : 第 (1) 步 需 O(logn) HT. O(n”) 处 理 器 ; 
第 (2) 2598 O(logn) YT], O(n?) ARE, KLM WET MARU. BAG n 一 1 条 边 
相关 联 ， 故 计算 每 个 顶点 的 权 值 最 小 关联 边 需 O(logn) IERI. O(n”) 处 理 器 ; 第 (3) 步 同 
第 (2) 步 类 似 ， 故 需 O(logn) HEEL, O(n?) 处 理 器 ; 第 (4) 步 的 实现 可 用 Hirschberg F 
法 ， 故 需要 O(logn) HEL. O(n?) 处 理 器 。 算法 至 多 需 执行 ! = Tlogn1 次 循环 (1 < 1 
xt). 故 整 个 算法 需 O(log n) RM O(n?) 处 理 器 ， 

由 此 可 知 ， 基 于 Sollin 算法 的 并 行 化 算法 ， 本 质 上 是 Hirschberg 算法 的 一 种 简单 变 
形 ， 风 而 基于 Hirschberg 算法 的 全 部 求 连通 分 支 算法 都 可 修改 为 求 MST 的 算法 。 


定理 5.2 ”基于 Hirschberg 的 顶点 倒塌 法 设计 的 MST 算法 与 基于 同一 方法 的 连通 分 支 算 
法 具有 相同 的 时 间 复杂 考 及 处 理 器 复杂 性. 
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证 明 ”将 Hirschberg 连通 分 支 算法 的 “每 次 选取 邻接 顶点 的 最 小 的 超 顶 点 ”这 一 步 改 
为 “每 次 选取 边 的 权 值 是 最 小 的 邻接 超 顶 点 ”， 并 且 把 每 个 连通 分 支 中 、 所 有 与 其 它 连 
通 分 支 的 邻接 边 中 的 权 值 最 小 边 记 录 下 来 ， 作 为 MST 的 边 即 可 ,无论 是 计算 时 间 还 是 使 
用 的 处 理 器 数目 ， 和 对 应 的 连通 分 支 算法 均 有 相同 的 复杂 人 性 . 
推论 5.1 在 SIMD 一 CREW PRAM 上 ， 求 一 无 向 连通 的 加 权 图 G, E) [Vian 
的 MST 需 O(log n) BYE]. O(n” / log^n) 处 理 器 。 
证 明 ”由 第 四 章 最 优 连通 分 支 算法 可 知 ， 求 G(V,E)，|IV|=n 的 所 有 连通 分 支 
需 O(log^n) i S]. O(n” /log’n) 处 再 器 ， 又 由 定理 5.2 可 知 ， 基 于 顶点 倒塌 方法 的 MST 
算法 和 同类 的 连通 分 支 算 法 其 有 相同 的 时 间 和 处 理 器 复杂 性 。 所 以 计算 图 G 的 MST 
f$ O(log*n) IIE]. O(n? / log? n) 处 理 器 ， 

参考 文献 [3] 给 出 了 具有 推论 5.1 算法 复杂 性 的 MST 算法 ， 为 了 避免 和 第 四 章 算法 
的 重复 ， 故 在 此 不 再 叙述 。 


52 树 机 上 的 MST 算法 


Bentley 基于 一 种 心动 树 机 模型 (图 1.13) . 将 Prim — Dijkstra 最 小 生成 树 算法 移 
HERNE Ah TRIES MERRIA”, 

假定 图 G(V,E), V=fl, 2, ^, n}. RRM MAR IAM BR W. Prim 

— Dijkstra 算法 的 基本 思想 是 ， 令 ,syV 是 最 小 生成 树 的 顶点 集 ，7T(VY,) 是 MST 的 边 


RE. Bev, lev, Bw", j )= mi {wap} Jl 
me 


Viv Uh TV Ye TV Jof 
Mees, ABV cup THD os 以 后 每 次 循环 时 ， 假 设 顶点 集 V, 和 边 
8 T.) 已 构造 好 ， 对 每 个 i 寺 V,，i 与 树 的 顶点 jeV, 关联 边 的 权 值 为 w(i, 站 选取 这 样 
f do WE WU, D= min fw, D. JL, = 4) = wG,D. 然后 从 所 有 eV, 中选 


Bhi", 使 得 1 一 min 和 |i$V, Miery Hi MEY, P AG, 7) MBI TA) 
P, BRATH EV, 的 7, 值 和 值 ， 经 过 一 1 KERE, REV, — y. XR TQ) 
A MST 的 所 有 边 。 

现在 ， 我 们 形式 化 地 描述 树 机 上 的 MST 并 行 算法 如 下 : 


算法 52 MINIMUM SPANNING TREE ON TREE MACHINE . 
输入 : 每 个 叶 处 理 器 i 存 贮 着 i 的 关联 边 权 值 向量 w(i,j)(1 «ny Bi, j 不 关联 ， 
A X w(i,]) = oo; 
输出 :每 个 叶 处 理 器 i 有 两 个 局 部 变量 集合 VV 0). HIV, EMP RMAEMSTHO RA 
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顶点 和 部 分 边 ， 整 个 MST 为 Ü TV D. 


int 
begin 
(1) for each i:1«ixn pardo /* 初 始 化 */ 
if i=l / * 第 一 个 处 理 器 工作 * / 
then V (D)e fl}; TV (Dep; low; Jj —1; flg(D-0 
/*fagü)21 表示 处 理 器 1 是 活动 的 * / 
ese VG); TV Meo; 1,- wil); 1; fiag(i) - 1 
endif 
endfor ; 
(2) root broadcasts vertex i' =1 to all leaf processors by tree; 
/otWC 广播 到 所 有 叶子 中 * / 
for ke1 to n — 1 do 
(3) for each i: 1<i<n pardo 
i fagi) =i / * 当 处 理 器 i 是 活动 时 ， 则 工作 * / 
then if I > w(,i^) then 1 = w(i i^); ji^ endif; 
send (/ pb to its father processor 
endif 
endfor ; 
(4) for cach non__leaf processors pardo 
/*,, i) RC, i, PHAKRANTER AE E+ / 
if it is root 
then if <i, then i^ ci, else i^ ci, endif ; 
broadcasts i" to each leaf processor by tree 
else if 7, «1, 
then send(/ pi P" to its father processor 


else send(/,,i,) to its father processor 


R R 
endif 
endif 
endfor ; 
(5) for each i:1«i«n pardo 
if flag()— 1 /* 将 新 的 MST 边 加 入 到 TV 中 去 * / 


then if i-i 
then VG — V Gofi Y; TV ATV, MUG, t; flag() + 0 
endif 
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endif 
endfor 
endfor 
end. 


这 个 算法 的 正确 性 是 显然 的 ， 证 明 从 略 ， 

定理 5.3 ”在 树 机 模型 上 ， 找 一 个 连通 加 权 无 向 图 G(V,E). Vlen 的 MST， 算 法 5.2 
需 O(nlogn) MT. O(n) 处 理 器 . 

证 明 ”算法 5.2 的 第 (1) 步 需 0(1) 时 间 、0O(m) 处 理 器 ; 第 (2) 步 需 O(logn) HE. OQ 
处 理 器 ; 第 (3) 步 需 0(1) TL. O(n) 处 理 器 ; 第 (和 4698 O(logn) HTM. O(n) 处 理 器 ; 
第 (5) 步 需 0(1) 时 间 、O(n) 处 理 器 ; 且 第 (3) 步 至 第 (5) 步 执行 了 4 一 1 次 ， 故 整个 算法 
需 O(nlogn) RTI), O(n) ARRE. 


顶点 14 


16 
18 14. 15 


图 5.1 Bentley 的 最 小 生成 树 算法 的 一 个 循环 步 
每 个 三 元 组 表示 : 1) 候选 项 点 ; (2) 最 邻近 的 树 顶 点 ; (3) 与 树 的 距离 。 


Bentley 还 建议 了 一 个 改进 的 算法 ， 在 保持 时 间 复 杂 人 性 不 变 的 前 提 下 ， 用 更 少 的 处 理 
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器 树 机 来 计算 图 的 MST. 具体 地 讲 ， 叶 处 理 器 数 减 少 到 O(n /logn) 来 实现 算法 ， 这 时 ， 
每 个 时 处 理 器 SOIS Tn loga) ESEA llogaV USUS JU DUE HERE RE BT X 
W((-1) flogn1: i Nogal; 1:n)，【《 报 后 一 个 叶 处 理 器 的 邻接 矩阵 可 能 不 够 Tlogn] 个 顶 
点 ) 。 位 于 园 一 叶 处 理 器 内 的 顶点 按 顺 序 计算 .由 于 每 个 叶 处 理 器 至 多 含 [iogn1 个 顶 
点 ， 故 计算 时 间 至 多 为 rlogn1， 为 此 得 : 
推论 5.2 在 SIMD 树 机 模型 上 ， 求 无 向 连通 的 加 权 图 的 MST， 算 法 5.2 使 
用 O(n / logn) 处 理 器 可 在 O(nlogn) 时 间 内 完成 ， 
证 明 ”类 似 定理 5.3 的 证 明 。 

图 5.1 例 示 出 用 O(a / logm) 处 理 器 的 树 机 来 实现 算法 $.2 的 一 个 循环 步 . 


5.3 二 维 网 孔 上 的 MST 算法 


5.3.1 算法 的 基本 原理 


Atallah 等 人 > 中 基于 Solin 算法 和 顶点 倒塌 方法 ， 在 二 维 网 孔 (x x 个 处 理 器 ) 上 建 
议 了 一 个 MST 算法 。 他 们 的 算法 的 基本 思想 是 : 算法 由 许多 次 循环 组 成 。 在 每 次 循环 
时 ， 上 废弃 已 属于 同一 个 连 道 分 支 的 边 。 在 两 个 连通 分 支 之 间 ， 若 存在 两 条 或 两 条 以 上 的 
边 ， 则 只 保留 它们 当中 权 值 最 小 的 一 条 边 ， 删 去 其 它 的 边 。 这 样 图 G 的 同一 个 连 道 分 支 
内 的 顶点 就 形成 一 个 超 项 点 ， 下 一 次 循环 是 在 由 所有 超 项 点 形成 的 图 上 进行 操作 . 


5.3.2 算法 的 非 形式 化 描述 

本 节 介 绍 的 算法 是 在 nx a 个 处 理 器 网 乱 上 的 并 行 算法 。 假 定 处 理 器 按 行 主 方式 编 
F. 算法 的 输入 是 加 权 邻 接 矩 阵 ， 也 就 是 编号 为 (i ) 的 处 理 器 GEE PE,) 内 存放 着 
wij) RARR HOY MST 的 邻接 矩阵 T, PE, 内 存放 着 TG), Æ 70ij)=1,， 则 1 与 j 
之 加 的 边 是 MST HUO < Lj« n). 

在 给 出 算法 之 前 ， 首 先 我 们 引入 在 网 孔 上 几 种 简单 的 数据 移 劲 操作 ， 
L 水 平 转动 

每 个 处 理 器 创建 一 个 它 的 数据 副本 .然后 每 行 上 的 数据 副本 在 处 再 器 上 象 一 队 士兵 一 
样 ， 首 先 向 左 移动 ， 当 数据 元 素 到 达 PE 时 ， 它 弹 回 继续 向 右 移动 ， 直 到 它 在 PE,, 处 再 
次 被 弹 回 向 左 移动 ， 当 数据 元 素 移动 到 它 开 始 出 发 时 的 位 置 就 停 目 下来。 显然， 开始 位 于 
PE 位置 的 数据 元 素 访问 了 第 i 行 所 有 的 处 理 器 (1 < i, jn). SERGX — HESS OCIS HT. 
2. 垂直 转动 

类 似 于 水 平 转动 ， 韦 始 位 于 PE, ,的 数据 元 内 将 访问 第 j 列 所 有 其 它 处 理 器 (1 < i,j 
么 月 ， 完 成 这 一 操作 也 天 O(m 时 间 ， 
3. 随机 存 取 写 

初始 时 ， 存 在 这 样 一 些 处 理 器 〈 处 理 器 数目 大 于 等 于 1) . 它 们 中 的 每 一 个 ， 
如 PE,， 会 有 另 一 个 处 理 器 PE，， 的 地 址 (i 个 ， 在 一 次 随机 存 取 写 时 ， 我 们 把 PE, 的 
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内 容 送 人 对 应 的 PE, 中 ， 假 定 没有 两 个 处 理 器 将 它们 的 数据 送信 同一 处 理 器 中 ， 实 现 这 


种 操作 需 O(n) mtg, 
4. 带 冲 突 的 随机 存 取 写 

基本 上 同 随机 存 取 写 一 样 ， 不 同 的 是 可 能 存在 多 个 处 理 器 想 把 它们 的 数据 写 和 同一 
地 址 ， 解 决 这 种 写 冲突 的 方法 是 优先 权 高 的 处 理 器 写成 功 (最 高 优先 权 可 定义 为 按 某 种 
编号 方式 给 处 理 器 编号 ， 如 按 编号 最 小 的 处 理 器 优先 权 最 高 ) .完成 这 一 操作 需 O(n) 时 
fi]. 


构造 MST 是 由 一 系列 循环 组 成 的 。 每 次 循环 完成 下 列 计算 (初始 时 了 = (5) : 

{1) 工 的 每 个 连通 分 支 都 选择 一 条 连接 了 中 两 个 连通 分 支 的 边 ， 且 这 条 边 是 所 有 这 
样 的 边 中 权 值 最 小 的 《假定 图 G 的 每 条 边 权 值 不 相等 ) ; 

Q) 把 上 一 步 选 择 出 的 那些 边 加 入 到 T 中 ， 算 法 重复 地 执行 (1) 及 (2)， 直 到 了 成 为 
一 个 连通 分 支 时 才 终 止 ， 显 然 ， 算 法 循环 的 次 数 不 超 过 [logn1. 

每 次 循环 后 ， 立 即 废弃 掉 图 G 中 属于 了 的 同一 个 连通 分 支 的 边 ， 若 两 个 连通 分 支 之 
间 有 多 条 边 连接 它们 ， 除 保留 一 条 权 值 最 小 的 边 外 ， 上 废弃 掉 所 有 其 它 多 余 的 边 ， 最 后 将 
图 G 的 同一 个 连通 分 支 内 的 顶点 倒塌 为 一 个 超 顶 点 . OG, 表示 第 上 次 循环 后 图 G 808 
后 的 归 约 图 (G, = C)。 注意 G, 的 每 条 边 (i) 实际 上 是 图 G KH (5^. 

算法 的 详细 描述 如 下 : 


算法 5.3 MST ON MESH ARRAY 

RA: 图 G 的 加 权 邻 接 矩 阵 于 = fw bs 

输出 : BGG Re RT AMET = {T t 

begin 

(DG,—G(V, E; TV, EX -(,; rei; 

(2) while 1G,|>1 do / *|G ŠEG ,的 项 点 数 * / 

(2.1) 对 G ，, 的 每 个 顶点 v， 在 G，， 中 选择 一 个 与 y 关联 和 且 权 值 最 小 的 边 (v, x*)， 
令 百 ， 是 已 选 出 的 全 部 边 的 集合 ; 

(2.2) 将 吾 , 中 的 边 与 G 中 对 应 的 边 放 入 了 中 ， 

(2.3) 构造 G,， 将 厅 ,的 同一 个 连通 分 支 内 的 顶点 归并 为 一 个 超 顶 点 ， 使 得 每 两 个 连 
通 分 支 之 间 只 保留 权 值 最 小 的 边 ， 同 时 还 广 弃 属于 同一 个 连通 分 支 内 的 边 
endwhile 

end. 


请 读者 注意 ， 在 第 : 次 循环 执行 之 前 ，G，， 中 的 顶点 数目 就 是 T 的 连通 分 支 个 数 。 
因此 ， 若 G, LAUR. Rb !<a /2 。 为 了 减少 在 整个 网 络 上 数据 移动 的 开销 ， 我 们 
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假定 G，，, 的 加 权 邻 接 矩 阵 可 以 “固定 ”在 一 个 7 x ! 的 处 理 器 子 阵列 中 ， 朵 而 第 : 次 循环 
时 ， 只 需 OQ) 时 间 。 下 而 我 们 将 会 证 明 ， 第 : 次 循环 确实 可 以 在 OC) 时 间 内 完成 所 以 


整个 算法 可 以 在 Y. 0(n7/2' ) = O(n) 时 间 内 完成 。 


在 描述 第 :次 循环 之 前 ， 我 们 简单 地 描述 一 下 这 次 
循环 前 、 后 的 邻接 和 矩阵 的 存放 格局 。 在 第 :次 循环 开始 
WB. Go 的 邻接 和 矩阵 已 存放 在 左上 角 的 Dx i 个 处 理 器 中 
a EBSD, Ë Glii )=1， 则 处 理 器 PE 含有 G 的 
310,4 7). GL) VE Gi 中 表示 为 (i.j BARBERA 
wij) BL w(i,j ")。 此 外 ， 在 第 1 次 循环 之 前 已 选 出 
的 工 的 边 存 贮 在 左上 角 的 1x /个 处 理 器 以 外 的 处 理 器 
" 中 ， 每 条 边 作为 一 个 特殊 对 (x, WHE. FEA 
多 可 存 贮 两 个 这 样 的 特殊 对 . (在 最 后 一 次 循环 时 ， 邻 
RES 可 通过 两 次 随机 存 取 写 得 到 ， 也 就 是 说 舍 
有 (x 办) 特 殊 对 的 PE, 向 PR,, 发 号 Ttx,y)=1 的 消息 ) ， 不 难看 出 ， 上 述 的 所 有 要 求 在 第 一 
次 循环 执行 之 前 是 满足 的 。 当 第 :次 循环 终止 时 ，G, 的 邻接 矩阵 必须 存放 在 左上 角 rx? 个 
处 理 回 中 (1 和 < 1/ 2， 而且 此 次 循环 产生 了 的 边 将 作为 特殊 对 存 贮 在 左上 角 的 xP 个 处 理 
器 之 外 ， 但 是 在 左上 角 的 Dx 1 个 处 理 器 之 内 。 
第 :次 循环 的 初始 化 是 执行 一 个 水 平 转动 〈 指 在 左上 和 角 Lx I 个 处 理 器 子 阵列 上 ) 操 
dE. REAR, AT PE, Ge D) 在 G，， 中 选择 了 一 条 权 值 最 小 的 边 (i, x) ， 在 水 平 转 
动 之 后 ， 接 着 执行 一 个 垂直 转动 ， 选 择 了 边 G, x) PE, VPE, 及 PE, BH x) 
= LALA (x, )=1, RARA HG, 门 = 工 的 处 理 器 创建 一 个 特殊 对 (7, 7)、 现 在 ， 形 
成 G, 的 邻接 矩阵 并 把 G 散人 左上 角 的 x! 个 处 理 器 之 前 ， 我 们 必须 清除 那些 含有 特 
殊 对 的 处 理 器 。 又 因为 < 1/2， 所 以 只 要 清除 左上 角 的 (17/2) x (17 2) 个 处 理 器 即 可 。 
完成 这 一 任务 只 需 OU/2) 时 间 。 即 左上 角 (1/ 2) x (7 2) 个 处 理 器 的 特殊 对 垂直 向 下 移 
动 1/2 次 . 在 经 过 1/2 次 移动 后 位 于 PE,,(1 < x,y <<1/2) 内 的 特殊 对 移 到 了 处 理 
PE ya, AHIS 
下 而 创建 G ARRE RANE: 首先 ， 计 算 和 矩阵 H, 的 传递 闭 包 万 ，， 然 后 
作 水 平 转动 。 这 时 每 个 PE,, (1 < i <1) 计 算出 DQi) 一 一 i 所 在 连通 分 支 标识 〔 即 此 连通 
分 支 的 最 小 标号 项 点 ) ; 然后 作 水 平 转动 和 垂直 转动 ， 将 DO 播送 到 第 1 行 及 第 7 列 ; 再 
K RAPE Me ÆG 0)-1B8 DG) £ DG). BI PE, GI — ANER 
F G (Di), DUY- 1 Aw (OG), DU) w, GA) BA PE pw): BS SE”. 
JUR (wG^,j^). 1 ^) 最 小 的 写成 功 ， 接 下 来 再 做 的 是 : 怎样 把 G， BREED AE 
HHT xz 个 处 再 器 中 去 ， 其 方法 如 下 : 
Q) =k | D) = k M k <ih; 
(2) 把 r BAR ITR iA 
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图 52 数据 在 网 筷 上 的 存 贮 示意 


(3) G,(,7) = 1 的 PE 创建 消息 告诉 PE, BG CD, <1. wirt, r) 
< wi, DEG MU), REM, j^. APE, 创建 这 一 消息 后 ， 废 
REDEG BRE, 消息， 然后 执行 随机 存 取 写 ， 则 所 有 消息 都 送 到 了 目的 
地 。 其 结果 ，G, 存 贮 在 左上 角 的 x x P 个 处 理 多 阵列 中 、 
算法 执行 了 rlogn1 次 循环 后 ， 每 个 含有 特殊 对 (xy) 的 PE, 创建 消息 T(x,)=1 
给 PE,,， 然 后 执行 随机 存 取 写 ， 又 因为 每 个 PE 至 多 含有 了 两 个 特殊 对 ， 所 以 至 多 两 次 
ROLES OTT 


533 ”算法 的 复杂 人 性 分 析 
在 分 析 算法 的 复杂 性 之 前 ， 我 们 先 引用 将 在 第 六 章 要 证 明 的 引 理 . 
引 理 5.1 nxn HEALE R a MERER 的 传递 团 包 需 O(n) IERI. 
证 明 ” 见 本 书 第 六 章 定 理 6.4. 
定理 5.4 在 SIMD 的 二 维 网 孔 上 ， 求 无 向 连通 的 加 权 图 GQV,E). |V| = 于 的 MST. 算 
353 08 O(n) thi], O(n?) 处 理 器 。 
证 明 ”算法 5.3 是 由 [logn1 次 循环 组 成 的 。 第 ! 次 循环 需 OU) 时 间 (1, <n 7/2/77). 改 
所 有 的 循环 需要 的 时 间 为 : 


fomi [v 


Y oups Y 0072 )-00) 


而 最 后 的 殖 机 存 取 写 需 O(n) 时 间 . 因此 整个 算法 需 O(n) 时 间 和 O(n”) 处 理 器 ， 


54 MST 的 更 新 算法 


增值 图 论 算法 (Incremental Graph Algorithm) 是 指 对 图 作 一 些 增值 改变 后 ， 重 新 
计算 图 原先 具有 的 性 质 的 一 类 算法 。 所 谓 增值 指 的 是 图 中 顶点 的 增加 或 减少 ， 边 权 值 的 疏 
变 等 ， 本 节 我 们 介绍 一 个 MST 更 新 算法 。 


5.4.1 基本 概念 

我 们 用 (a,8) 表 示 顶 点 a 与 顶点 5 之 间 的 一 条 无 向 边 ，<ab> 宕 示 一 条 有 因 边 ， 其 方向 
是 从 a 到 b. 约 定 顶点 # 到 顶点 ?的 无 向 路 径 为 bt- 阔 有 向 路 径 为 [e> 路 道 树 是 一 柑 有 向 
树 ， 它 有 一 个 特殊 的 顶点 ， 称 为 树 根 . Hu 在 "到 根 的 路 径 上 ， 则 顶点 u 称 为 项 点 ?的 祖 
Je, d» 称 为 u 的 一 个 子孙 。 一 个 顶点 的 父 顶 点 是 它 的 最 亲近 的 祖先 ， 树 工 中 项 点 zx ?的 
最 低 公共 祖先 (The Lowest Common Ancestor) LCA(x,yMé x，y 的 最 亲近 的 共 间 祖先 ， 且 
x 和 了 的 所 有 其 它 公共 祖先 也 是 LCA(x,y) 的 公共 祖先 ， 若 一 棵 树 的 边 都 按 从 儿子 到 父 硕 
点 定向 ， 得 到 的 有 向 树 称 为 省 树 (Inverted Tree)", BPW «abo km b dt a HLL 
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点 。 一 个 顶点 v 到 根 的 距离 称 为 v 的 深度 。 
4 T -(V', E) EÉ— BB. V= fl, 2, -. nl rd T BIB. 在 根 1 处 带 有 自 环 
的 逆 树 可 以 用 一 个 函数 严 访 -~ 到来 表示 ， 其 中 : FOETA i A Ger), BF 
=r, 根据 这 个 函数 已 下面 我 们 定义 函数 E: V V (k > 0): 
Fo- f k=0 
"ae iy, xk#0 
SERA IHERERPR F" (0) (0 < 大 < 中 的 算法 。 假定 处 理 器 以 行 主 方式 编号 ， 且 使 用 骆 个 
处 理 器 。 


ff£iev' 


算法 5.4 ANCESTORS IN INVERTED TREE 
RA: ERTA BRE F Pom, Xo: FüMRg WAR (93D. SIAR RA 
Fü) =i; 
ih: 每 个 顶点 ieV 的 所 有 祖先 F*(i), Ok «n, iev. 
begin 
(1) for cach i:1xixn pardo /* PE(i,1) 执 行 指令 * / 
Fei; F()-F() 
endfor ; 
(2) for 1-0 to Hlog(n — 11 — 1 do 
for each is: (1 S i& n)A(1 & s & 2^) pardo 
FY oF guy 
endfor 
endfor 


end. 


9H 52. YE SIMD - CREW PRAM 上 ， 若 已 知 逆 树 函数 FL WT F Gh i 
EV, Ok «n 的 算法 5.4， 可 使 用 O(n*) 处 理 器 在 Oliogn) HAAR. 

证 明 ”由 算法 5.4 可 知 ， 严 * 是 由 前 面 的 循环 计算 出 来 的 严 ，(f nx) 复合 而 成 的 。 等 一 次 
循环 ， 都 使 项 点 的 祖先 个 数 增 加 一 倍 ， 而 一 个 顶点 至 多 有 nm 一 1 个 祖先 ， 故 rlog(n — 1)1 
一 工 次 循环 就 可 以 计算 出 全 部 祖先 ER KEENE 0(2'n) 处 理 器 ， 帮 整个 算法 
4% O(logn) IIR. O(n^) taR. 

人)，(1 < i<n,1<k<n) 的 实际 计算 是 通过 一 个 二 维 数组 严 完 成 的 。 严 (问好 
AF. —ELF* 计算 完成 ， 顶 点 i (1 <i <n EM T dI depth() 可 以 通过 对 F! 的 
第 i 行 执行 二 分 法 搜索 来 实现 ， 根 + 最 左 出 瑰 的 位 置 GIS) 即 是 i 的 深度 ， 故 完成 
depth(i), (1<i< n) 的 计算 需 0(logn) 时 间 和 O(n) 处理 器 ， 然 后 将 深度 信息 存 人 一 维 数 组 
D' 中 。 在 计算 出 D' 之 后 ，F' 的 每 行 向 右 欧 动 ， 直 到 最 左 出 现 的 + 在 最 后 的 一 列 为 止 。 如 
图 5.3 Bra. 
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引 理 5.3 Æ SIMD — CREW PRAM 上 ， 计 算 一 棵 逆 树 TIVE), |W n BEA T 
对 (x.y) 的 最 低 公 共 祖 先 需 O(logn) IBI. O(n^) 处 理 器 (1 < x,y <n). 

TEA ”因为 图 TUE YE C, = On MAAR. Qu v HAMR S w 是 它们 的 最 低 公 
HK LCA). 那么 可 用 一 个 处 理 髓 在 F* 的 第 zx 行 与 第 ， 行 执行 二 分 法 搜索 ， 并 且 定 位 
这 两 行 最 先 击 现 的 共 问 顶点， 即 是 最 低 公共 祖先 ， 故 着 共 需 0 (logm) 时 间 、O(n 7 ) 处 埋 器、 


oeli|zT3]a|s|e[7]a 


19 up 


-iw 


.| I S UPS 


msm 


(a) dip 


图 5.3 用 二 维 数组 计算 P 
说 明 ; 在 惨 行 向 右 平移 后 ， 最 右 列 表示 树 根 ， 空 白 项 表 未 未 定义 项 、 


下 面 我 们 讨论 通过 它们 最 低 公共 祖先 的 任意 两 个 顶点 之 间 的 路 径 世 一 LCA 人 zx 一 中 
上 权 值 最 大 边 的 计算 问题 . 

GER MAX e, e.) 的 返回 值 是 e, Me, 中 的 一 个 权 值 较 大 的 边 . A EEM (<i 
xn) ERCE T PR k SEARRE LORRA H. WA: 

(D EG 是 边 ( FG; 

Q) E.G) ile - MAX (EI (0), (F^ 

{3) 假定 根 r U(r. yA- o. 
引 理 5.4 在 SIMD — CREW PRAM 上 ， 所 有 的 EQ), 1<icn, I«k«nfitf 
需 O(logn) 时 间 、O(n”) 处 理 器 . 
证 明 “类似 于 引 理 S2 的 证 明 。E* (i) 的 计算 可 以 用 二 维 数组 E* RER. ET GLK) 是 从 
顶点 i 到 它 的 第 k 非 祖 先 这 条 路 径 上 权 值 最 大 的 边 . 
引 理 5.5 在 SIMD — CREW PRAM E, BAGER TOV’, E') 的 二 维 数组 F^. E" AI 
维 数组 D*, HAMA uev, vev! 之 间 的 路 径 [uw — v] ESUBECKIIISE O(logn) 时 间 


1 


Q. F'G». k>1; 
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和 O(n”) 处 理 器 . 

证 明令 we 是 顶点 u,v 的 最 低 公共 祖先 LCA»). ANS w 是 4 的 第 x 辈 祖先 ，w 
是 ?的 第 辈 祖先 ，x 和 了 的 值 可 以 从 深度 信息 得 到 。 那 么 路 径 [一 可 上 上 权 值 最 大 的 边 
dE MAX (E7 (u) E? O). 


542 顶点 更 新 的 MST 算法 
当 从 原来 图 中 删除 或 插 人 一 个 顶点 时 ， 都 涉及 到 重新 构造 新 的 MST 问题 。 本 节 我 

们 仅 考虑 顶点 插 和 人 问题。 因为 从 图 中 删除 项 点， 重新 构造 MST 困难 较 大 。 例 如 ， 若 原来 
的 MST 是 星 形 结构 ， 当 删 去 中 心 顶点 后 ， 则 将 删除 掉 所 有 的 树 边 。 
1 算法 的 基本 原理 V 

Pawagi AUI 给 出 的 算法 ， 其 关键 在 于 怎样 利用 不 太 多 的 处 理 器 ， 快 速 地 检查 旧 
的 MST 的 边 以 及 由 播 入 顶点 引进 的 新 边 。 我 们 注意 到 : 与 新 顶点 关联 的 一 对 边 将 导致 在 
旧 的 MST 中 形成 一 个 环 。 而 与 新 顶点 关联 边 的 数目 至 多 为 故 在 旧 的 MST 中 创建 
T C1 = O(n”) 个 环 .算法 的 基本 思想 是 : 移 去 环 中 权 值 最 大 的 边 ， 将 所 有 的 环 断 开 ， 结 
果 得 到 的 图 就 是 更 新 后 的 MST.。 
2. 算法 的 非 形式 化 描述 


算法 5.5 UPDATING MST BY ADDING A NEW VERTEX 

输入 : BROKER PAAR) PEME EIS I aoa RW 

输出 : 新 的 MST 〔 仍 以 北 树 形式 看 贮 ) . 

begin 

/* 令 z 是 插入 到 图 中 的 新 顶点 * / 

(1) 计算 月 的 MST 的 MI /*M'-MAX,* / 

D 计算 昌 所 有 由 z 导 出 的 环 C 中 权 值 最 大 边 ， Hoe, Su, v2 MST 的 两 个 顶 
点 ， 且 令 (z,2)，(z, ) ŽA u, v 关联 的 两 条 新 的 边 。 由 (z, u) 与 [u — v) A (v,2) 
BRK PRAM (zu) (2, v) RM (u,v) 中 的 一 个 . BARAM 
Sei, HüdE(w(u,) minfuv}, maxíuys p FRAG; 
Ri) ihihieih, did BE E AEREI V] dein. AMMA 
引起 写 冲 突 ， 可 采用 文献 中 的 方法 解决 之 ; 
将 疡 的 MST 仍 以 递 树 形式 存 迪 具体 方法 是 : 在 出 除 四 的 MST 的 边 时 创建 了 落 
王子 树 ， 现 在 用 与 z 的 关联 边 将 这 些 子 树 连接 成 一 柠 新 的 MST。 设 创建 了 大 榨 子 
树 ， 其 根 分 别 为 x|，x，，"…，X,， 它们 与 z 关 联 的 顶点 分 别 为 w，， w, 


w,. HORREA S m MST Kt F^ SF + 这 个 数组 含有 w, Six, oe wy 


k 


到 XxX, 的 路 径 。 将 这 些 路 径 上 边 的 方向 反 过 来 ， HO zh m v, x. Ra 


G 


{4 
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向 指向 z。 这 样 z 就 成 了 新 的 MST 的 根 


end. 


定理 5.5 CERE IER. 
A SG, 是 由 新 的 顶点 z 加 入 旧 的 MST 中 形成 的 图 ， 在 新 项 点 z 插 人 原来 MST 时 
引起 MST 更 新 问题 。 令 T 是 上 述 顶点 更 新 算法 执行 后 得 到 的 图 。 首 先 T" 是 无 环 图 。 
为 在 第 (3) 步 ， 我 们 将 所 有 的 环 都 断 开 了 .现在 假定 T' 是 由 几 个 连通 分 支 组 成 的 .考虑 
FIARE E: 

E, fe 1e 是 的 两 个 连通 分 支 之 间 的 边 、 且 e G ,的 删除 边 }， 
Se, 是 集合 已, 的 权 值 最 小 连 。 我 们 考虑 G。 中 含有 e n HRC. CEDE T 的 
两 个 连通 分 支 的 顶点、 因此， 天 ,中 至 少 有 两 条 边 . 不 难看 出 ，e 不 可 能 被 删除 ， 这 是 
因为 它 不 是 C 上 权 值 最 大 的 边 。 因 此 T! 只 有 一 个 连通 分 支 。 又 因为 每 条 非 树 边 是 形成 环 
的 权 值 最 大 边 ， 而 算法 5.5 俭 俭 出 除了 每 个 环 上 的 权 值 最 大 边 ， 所 以 T 是 MST. 
定理 5.6: 在 SIMD — CREW PRAM 上 ， 通 过 在 图 G(V,E), |V| o n 中 插入 一 个 顶点 引 
起 的 MST 更 新 ， 算 法 5.5 需 O(logn) ME. O(n?) ADHERE, 
证 明 ”由 引 理 S.S 可 知 ， 完 成 算法 5.5 的 第 (1) 步 需 O(logn) EFI, O(n”) 处 理 器 ; 由 该 
引 理 还 知道 ， 完 成 算法 的 第 (2) 步 需 O(logn) IHE. O(n”) 处 理 器 ; 而 第 (3) 步 需 O(logn) 
IMT. O(n?) ER, B (4) 步 计算 FP' AF O(log) HERI, O(n”) 处 理 器 ， 从 w， 
到 x,，"…， 从 w， 到 x, ORAL ETRE RI, OU) 时 间 和 O(n”) 处 理 器 ， 所 以 


顶点 更 新 算法 5.5 需 O(logn) 时 间 、O(n”) 处 理 器 。 


5.4.3” 边 更 新 的 MST 算法 


当 原 图 的 一 条 边 的 权 值 发 生 改 变 时 ， 需 重新 构造 MST。 若 树 边 的 权 值 减少 或 非 树 边 
权 值 增加 ， 那 么 旧 的 MST 将 不 作 和 尾 何 改变 ; 反之 ， 若 树 边 权 值 增加 或 非 树 边 权 值 减少 ， 
那么 旧 的 MST 可 能 发 生 改 变 。 然 而 ， 在 上 述 的 两 种 情况 下 ， 至 多 有 一 条 边 成 为 树 边 和 一 
条 树 边 成 为 非 树 过 。 
1. -算法 的 基本 原理 
(DD): 车 一 条 树 边 (x,y) 的 权 值 增加 ， 则 MST 修 改 如 下 : 
1? 删除 树 边 (x,y)，, 这 时 创建 了 两 棍子 树 组 成 的 森林 ; 
2° 对 每 棵 子 树 赋予 其 连通 分 支 标识 ; 
3， 找 出 连接 这 两 个 连通 分 支 且 权 值 最 小 的 一 条 边 。 
(2) 若非 树 边 (w,v) 的 权 值 下 降 ， 则 MST 修 改 如 下 : 
1° 把 (u,v) 这 条 边 加 入 到 旧 的 MST 中 ; 
2° 移 去 (4,v) 所 在 的 环 上 权 值 最 大 的 边 . 
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2， 莫 法 的 非 形 式 化 描述 


算法 5.6 UPDATING MST BY CHANGING EDGE'/S WEIGHT 

输入 : VASUBEE AAEM MSTA A EE HB VO EAR AREA WV, 

输出 : MER RAE RB Je MST. 

begin 

(1) 车 权 值 改变 的 边 (x,y) 是 菲 树 边 ， 则 转 到 第 (8) 步 ; 否则 执行 下 列 各 步 : 

Q) F(X) 一 x， 这 样 ， 从 昌 的 MST 中 删除 了 边 (x,y)， 创 建 了 两 标 树 组 成 的 森林 ， 它 
MARDI A rix 

(3) 计算 局" ,每 个 顶点 的 连通 分 支 用 根 结 点 标识 《从 户 ' 最 右 列 可 以 看 出 ) ; 

(4) 对 每 个 顶点 1 找 出 它 与 另 一 连通 分 支 连 接 的 权 值 最 小 边 1(1 ien RER} 
中 选 出 权 值 最 小 边 (u,v) i 

G) 3 (u,v) = (x,y) X Qr) = (yx), M Fx) y, URH, mi MST RAE 
KR, SMF (uv) 加 入 到 森林 中 去 ; 

(6) 新 的 MST 仍 旧 用 逆 树 形式 存 贮 ， 邻 u 的 根 为 x， 置 F(u)*- vy， 这 样 ， 就 给 边 (u,v) 
定 了 方向 , AE PORT BE x. 44d ox] La, HX 
得 到 了 [x us 

(7) stop, 

(8) RF. E^ fe D, Aa [x y AE EBORE IK ARE (u,v); 

(9) BX (u,v) 的 权 值 小 于 边 (x,y) 的 权 值 ， 则 旧 的 MST 不 变 ; SRM (uy) PPM 
把 边 (x,y) MAMRE A MST P; 

(10) 保持 MST 仍 为 递 树 ; 置 F(x) y; E F^ PM Buss [xu] 663145 E A6) ( 假 
定 8 与 并 是 祖先 一 子孙 关系 ) 


end. 


定理 5.7 在 SIMD — CREW PRAM 上 ， 图 中 一 条 边 权 值 的 改变 所 引起 的 MST 更 新 ， 
算法 5.6 需 O(logn) MT, O(n?) 处 理 器 ， 

证 明 ”首先 我 们 分 析 算 法 5.6 的 各 步 复杂 人 性， 然后 再 得 出 整个 算法 的 贫困 性 ,算法 的 
580). (2) 步 只 需 0(1) 时 间 、0(1) 处 理 器 ;由 引 理 5.2， 第 (3) 步 需 0(iogn) 时 间 、O(n”) 
处 理 器 ; 第 (4) 步 同 第 四 章 Hirschberg 算法 第 (3) HAMARE, W Ooga) 时 
M. O(n?) 处 理 器 ; 第 (5) 步 只 需 OC) 时 间 及 处 理 器 ; 第 (6) 2E FU 0(1) 时 间 、O(n) 处 
理 器 ; 第 (8) 步 由 引 埋 5.2 至 引 理 5.5 可 知 。 完 成 这 一 步 需 O(logn) MB]. O(n?) 处 理 器 ; 
第 (9) JE RUE 0(1) 时 间 及 处 理 器 . 第 (10) 步 同 第 (6) 步 有 相同 的 时 间 及 处 理 器 复杂 性 ， 所 
以 ， 整 个 筑 法 需 O(logn) INTEL, O(n”) 处 理 器 。 
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5.5 MIMD 共享 存 贮 模型 上 的 MST 算法 


Quinn" 基于 MIMD 紧 耦 合共 享 存 贮 模型 ， 实 现 了 Sollin 算法 的 并 
算法 完全 基于 顺序 的 Solin 算法 ， 所 以 我 们 首先 给 出 单机 的 Sonin 算法 。 


算法 5.7 SOLLIN'S ALGORITHM (SISD) 
RA: AARG EARR = fw h i JeV s 
输出 : G 的 最 小 生成 树 了 【 衬 以 边 的 形式 存 贮 ) . 
begin 
(1) for i—1 to n do /* 初 始 化 */ 
vertex i is initially in set i 
endfor ; 
(2) To, / + TAMST* / 
(3) while |T| «n —1 do / * 当 了 的 边 数 小 于 n 一 1 执行 循环 * / 
(4) for each tree i da / * 每 探 树 i 找 不 在 同一 树 上 的 最 小 权 值 
closest(i) — oo 
endfor ; 
(5) for each (v,;)eE do 
if FIND (v) 4 FIND(u) 
/ * 著 为 真 ， 说 明 vy 与 属于 不 同 的 连通 分 支 * / 
then if wlv,u) <closest(FIND(Y)) 
then closest (FIND(v)) e w(v,u) ; 
edge (FIND(v)) e (v.) 
endif 
endif 
endfor ; 
(6) for each tree i do 
(yu) edge(i) ; 


(7) if FIND(») x FIND(w) 
then Te To((v,u)) ; / * 将 新 的 树 边 加 入 树 中 * / 
{8) UNION(y,u) / x 归并 为 一 个 较 大 的 符 * / 
endif 
endfor 
endwhile 
end. 


# 行 化 。 因 为 他 的 


边 * / 
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HEE T AM FIND, UNION, FIND(y) 是 找 出 vy 所 在 的 树 的 标识 ; 
Ti UNION(»,u) 是 将 v 所 在 子 树 T, 与 z 所 在 子 树 7, 通过 边 Qu) 连接 成 一 棵 较 大 的 子 
树 且 以 一 个 较 小 子 树 标识 作为 妇 并 后 的 标识 ， 不 熟悉 的 读者 可 查阅 文献 

在 紧 克 合共 享 存 贮 的 多 机 系统 上 ， 上 述 算法 并 行 化 如 下 : 


首先 我 们 想到 的 对 while 循环 进行 并 行 
$4 ， Aks RRE: 因为 循环 之 问 存在 先后 制 
ZI 约 关系 ， 即 在 第 kH 次 循环 执行 之 前 ， 第 大 
ly, ARERR FAAA — EEG] LE 
i a 联 的 另 一 子 树 归 并 ， 所 以 while 循环 并 行 化 
Wa 1 1 
1 


效率 提高 是 有 限 的 .因此 我 们 在 循环 体内 考 
虚 并 行 化 . 算法 5.7 的 第 (4) 步 通过 适当 的 伪 

图 5.4 算法 5.7 并 行 化 引起 的 一 种 复杂 情况 调度， 可 以 使 其 并 行 化 . 设 第 : 次 循环 时 已 
Ain RTM. dE nm p， 则 把 这 n, 樟 子 树 较 均匀 地 分 配 到 p 个 处 理 机 中 ， 每 个 处 理 机 
HA T n,/ PRS BM, XX n APR n, 个 处 理 机 即 可 . 算法 5.7 的 第 
(5) 步 并 行 化 ， 最 有 效 的 做 法 是 : 首先 每 一 个 处 理 机 检查 它 内 部 的 顶点 的 边 ， 然 后 再 检查 
不 在 同一 个 处 理 机 上 树 之 间 的 边 ; 算法 5.7 的 第 (6) 到 (8) 步 并 行 化 则 更 为 复杂 ， 图 5.4 示 出 
了 这 种 情形 。 假 定 一 个 处 理 机 企图 将 B 树 最 近邻 居 4 树 人 归并， 变量 edge(4) 有 一 条 权 值 为 
k RBU) ER edge(B) 也 有 一 条 权 值 为 六 的 边 (va,wup)， 进 一 步 假定 两 个 处 理 机 都 在 执 
fi UNION 之 前 执行 了 第 (7) 步 的 测试 ， 那 么 (vw) 以 及 (va, ug BMAD TP. BRIG 
成 一 个 环 ， 显 然 这 是 错误 的 。 因 此 ， 要 使 第 (5) 到 (8) 步 并 行 化 ， 必 须 在 执行 第 (7) 步 之 前 上 
锁 ， 执 行 完 第 (8) 步 后 再 开锁 。 每 次 仅 允 许 一 个 处 理 机 进 人 临界 区 。 为 了 避免 死 锁 的 产 
生 ， 当 有 多 个 请 求 上 锁 的 进程 申请 临界 区 时 ， 仅 仅 让 标号 最 小 的 子 树 上 锁 。 
定理 5.8 在 MIMD 一 紧 耦 合共 享 存 贮 模型 上 ， 求 一 无 向 连通 的 加 权 图 G(Y,E) 
的 MST, 算法 需 O( Mogal(n? / p+a/ pn 中) 时 间 和 0O(p) 处 理 机 . 
证 明 ”为 简化 起 见 ， 假 定 FIND. UNION 操作 仅 需 OC) 时 间 ; 算法 的 第 (4) 步 并 行 化 
需 (n/ p+ pt 第 (5) 步 需 0(n / p+ p ER: 第 (6) 至 (8) 步 需 O(tr / pp p) E 
间 ，p 因子 是 锁 步 等 待 时 间 ， 整 个 while 循环 了 Hog) 次 ， 故 整个 算法 时 间 为 

O(n? / p+ n/ p+ p+n) flogal) 

HORA O (p). THEY p= O(Vai 时 ， 算 法 的 时 间 复 杂 性 最 小 。 


56 ”分布 式 MST 算法 


在 通信 网 络 中 ， 从 某 个 结 点 把 一 个 消息 广播 到 整个 网 络 中 ， 有 两 种 常见 的 方法 : 一 
种 称 之 为 洪水 淹没 (Flooding) 法 。 该 法 的 特点 是 : 网 络 中 的 每 个 结 点 ， 一 且 收 到 消息 后 ， 
立即 向 所 有 非 父 结 点 广播 接收 到 的 消息 。 这 里 ， 网 络 中 的 结 点 第 一 次 从 别 的 结 点 接收 到 消 
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息 时 ， 则 称 那个 发 送 消息 的 结 点 为 父 结 点 。 显 然 、 这 种 方法 的 通信 开销 非常 大 。 另 一 种 方 
法 是 基于 网 络 的 一 标 生 成 树 广播 ， 它 仅 需 网 络 中 结 点 数目 溅 去 一 的 消息 个 数 就 够 了 ， 因为 
任意 两 个 结 点 之 间 有 线路 相连 接 ， 而 通信 线路 的 费用 是 不 一 样 的 ， 所 以 我 们 给 每 条 通信 
线 赋予 一 个 非 灸 的 权 值 ， 为 了 达到 有 效 的 广播 ， 必 须 在 网 络 中 建立 一 棵 最 小 生成 
(MST), 因此， 在 基于 异步 通信 的 分 布 式 计算 模型 上 ， 计 算 网 络 的 MST 是 一 个 极其 重 
要 而 又 非常 基本 的 问题 。 


5.6.1. 算法 的 基本 原理 
Gallager 等 人 ”建议 的 MST 分 布 式 算法 ， 是 Sollin 算法 的 并 行 化 ， 他 们 的 算法 用 

到 一 个 非常 重要 的 概念 一 超 结 点 (Supernode)。 超 结 点 有 时 又 称 碎 块 (Fragment)。 在 整个 
通讯 网 络 中 ， 一 个 超 结 点 是 它 的 一 个 子 网 络 。 若 两 个 超 结 点 内 的 结 点 之 间 有 边 连 接 ， 则 称 
这 个 超 结 点 为 邻接 超 结 点 ， 假 定 超 结 点 代表 的 子 图 的 最 小 生成 树 已 经 生成 ， 并 且 有 树 根 。 
分 布 式 算法 的 基本 思想 是 : 每 个 超 结 点 试图 选择 一 个 且 仅 选择 一 个 合适 的 邻接 超 结 点 进行 
归并 ， 结 果 得 到 一 个 更 大 的 超 结 点 。 相 应 地 ， 把 这 两 个 超 结 点 的 MST 归并 成 一 棵 更 大 
的 MST。 所 谓 归并 ， 就 是 在 两 个 超 结 点 之 间 的 边 连接 中 选取 权 值 最 小 的 边 加 入 MST。 反 
复 应 用 上 述 的 过 程 ， 最 终 得 到 一 个 包含 整个 网 络 中 所 有 结 点 的 超 结 点 ， 这 个 超 结 点 
的 MST 就 是 我 们 所 要 计算 的 MST. 

为 了 减少 同一 个 结 点 参与 归并 过 程 的 次 数 ， 我 们 约定 : 一 个 超 结 点 只 人 允许 同 含有 足够 
多 结 点 的 超 结 点 进行 归并 .要 做 到 这 一 点 ， 每 个 超 结 点 S 都 要 维持 一 个 层 
号 level-_number(S)， 用 它 来 估计 一 个 超 结 点 S 内 所 会 结 点 的 数目 ， 一 个 野 号 为 天 的 超 结 
点 至 少 含 2 个 结 点 (O<k < Mogn). 

当 一 个 超 结 点 想 同 另 一 个 邻接 超 结 点 归并 时 ， 按 照 它 们 的 相对 层 号 采取 不 同 的 动作 ， 
具体 地 讲 ， 令 8 和 5" 是 两 个 正在 考虑 的 超 结 点 ， 当 8' 想 与 S 归并 时 ， 执 行动 作 如 下 : 

(1) #4 level_number(S)>Jlevel_number(S’), WS’ WAS S 归并 ， 
H level number(S) RÆ, 4H S^ 内 结 点 的 层 号 改变 成 lsveL_number(S)。 

(2) #4 level_number(S) <level_number(S’), W S 必须 等 到 S 的 层 
S level number(S) 变 得 足够 大 时 ， 才 能 与 S 进行 归并 ; 

{3) 车 level_number(S) = level _number(S)， 则 它们 立即 进行 归并 ， 并 将 结果 的 
超 结 点 S" 层 号 改变 ， 即 将 原 8 和 S 内 结 点 的 层 号 加 1， 即 

level_number(S”) = Jevel__number(S) + 1 

为 了 使 得 在 归并 过 程 中 所 使 用 的 消息 数目 尽 可 能 地 少 ， 每 个 超 结 点 都 要 维护 它 的 子 网 

的 MST， 且 在 每 个 超 结 点 内 部 ， 仅 通过 树 边 传递 消息 。 


5.6.2 算法 的 非 形式 化 描述 


算法 5.8 MST DISTRIBUTED ALGORITHM 
输入 : 每 个 结 点 ve VRAZ ENO) = {ul (vu)eE} 以 及 相应 的 关联 边 的 权 值 w(v,w) 
—3— 


Nue N(vy 
输出 : 最 小 生成 树 (MST). 
begin 
(1) for each node y do / * 初始 化 ， 标 识 成 超 顶 点 ， 置 标识 号 * / 
SeS'ev; ID()e-ev; 
Jevel__number(S)« level. number(S^) — 0 
endfor ; 
(2) while there cxist more than one supernode do 
(2.1) each supernode S tries to find a appropriate neighboring supernode S; 
(2.2) if level. number(S) «level number(S") 
then wait 
else S^ SUS! ; / * 归并 成 一 个 超 结 点 * / 
symbolize edge(u,v) into edge of tree; / *ueS,veS’* / 
if level... number(5) >level number(s’) 
then ID(S") - ID(S) ; 
level. number(S") — level. number(S) 
else ID(S”) — min{ID(S), ID(S)} ; 
level. number(S") — level__number(S) + 1 
end if; 
maintains MST of S" 
end if 
end while 


end. 


一 般 来 讲 ， 一 个 超 结 点 在 修改 其 MST 之 后 开始 进入 一 个 新 的 阶段 。 在 新 的 阶段 试图 
找 出 一 个 适当 的 邻接 超 结 点 进行 归并 《 即 算法 5.8 的 第 (2.2) 步 ) . 具体 做 法 是 : 令 每 个 
超 结 点 8 的 MST 是 了。， 在 Ts。 的 根 初 始 化 这 个 新 阶段 ， 根 结 点 通过 树 边 向 8 内 所 有 的 
结 点 广播 一 个 “请 求 ”消息 M. M 要 求 每 个 结 点 veS 去 找 出 邻接 超 结 点 中 的 结 点 x 
eS’, SEAM (yu) WRA RD. ERAJ v 记 住 边 (vu). BE wou) 和 超 结 点 的 
VIDS): 每 个 结 点 ves 收 到 消息 M 后 ， 发 送 一 个 “检测 ”消息 到 每 条 “未 检测 ”的 
边 ， 该 条 检测 消息 含有 超 结 点 标识 ID(S)， 且 ID(S) 可 以 是 树 根 结 点 的 编号 ， 在 算法 初始 
化 时 ， 必 须 标识 所 有 的 边 都 是 “未 检测 ” 边 ; 车 结 点 v 最 终 收 到 来 自 同一 个 超 结 点 中 结 点 
发 来 的 消息 ， 则 用 “拒绝 ”消息 应 答 ， 且 将 传递 消息 那 条 边 的 两 个 端 结 点 分 别 标 识 该 条 
边 是 “无 用 ” 边 ， 今 后 不 再 对 它 发 送 消息 ; 当 "最 终 找到 一 个 满足 条 件 的 邻接 超 结 气 时 【《 
车 不 存在 这 样 的 超 结 点 ， 则 v 简单 地 形成 一 个 “计算 终止 ”消息 ) ， 若 ”是 了 的 树 时 结 
点 ， 则 它 将 最 修 权 值 的 边 、 权 值 和 邻接 超 结 点 标识 等 信息 包含 在 消息 内 向 父 结 点 报告 ; 
一 个 内 部 结 点 一 直 等 到 收 到 所 有 上 儿 季 的 消息 后 ， 才 从 中 找 出 一 条 权 值 最 小 的 边 ， 并 与 自 
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己 找 出 的 最 小 权 值 的 边 相 比较 ， 然 后 从 两 者 中 选 出 最 小 权 值 的 边 ， 并 形成 一 个 消息 向 父 
结 点 报告 ， 所 形成 的 消息 包含 最 小 权 值 边 、 权 值 和 邻接 超 结 点 等 信息 内 容 ; 报 后 根 结 点 
将 决定 与 嘱 一 个 邻接 超 结 点 进行 归并 ， 它 沿 着 已 经 建立 起 来 的 、 由 树 边 组 成 的 路 径 发 送 
要 求 “ 归 并 ”消息 给 邻接 超 结 点 ， 这 条 消息 通过 邻接 边 到 达 邻 接 超 结 点 的 某 个 树 结 点 
中 ， 然 后 再 传送 到 邻接 超 结 点 的 树 根 结 点 上 ， 最 后 根据 这 两 个 超 结 点 的 居 号 ， 采 用 相应 
的 策略 进行 归并 处 理 。 

要 使 两 个 超 结 点 好 并 成 一 个 更 大 的 超 结 点 ， 对 树 的 修改 工作 莫 为 简单 。 将 连接 这 两 
个 超 结 点 的 最 小 权 值 边 标记 为 树 边 ， 令 Ou 是 这 样 一 条 边 ， 且 在 本 阶段 开始 时 ， 与 2 分 
别 隶 属于 超 结 点 S.A OS. {024 level number(s} < level_number(S) 才 发 生 归 并 ， 
39 level__number(S’) <level_number(S)， 则 ， 结 点 给 了 。 的 根 发 送 一 个 含 
有 level_number(S) 和 TD(S); 然后 根 结 点 广播 更 改 ,的 所 有 结 点 的 层 号 和 超 结 点 标 
识 ， 分 别 改 成 evel number(S) 和 ID(S); 再 后 从 v 到 T, 的 根 结 点 这 条 路 径 上 的 结 点 ， 
其 父子 关系 重新 标识 ， 即 父 结 点 现在 变 成 儿子 结 点 ， 而 儿子 结 点 变 成 为 父 结 点 ， 且 ， 在 结 
桌 的 超 结 点 的 树 中 ， 其 父 结 点 为 x， 若 是 level_number(S) = level_number(s’), MAH 
SUS” 的 标识 ID(S") = minfTD(S ,ID(S)1; 结 点 4 和 ?将 新 的 标识 分 别 送 到 T AT, 
的 根 结 点 ， 之 后 每 个 根 结 点 广播 更 改 层 号 和 超 结 点 标识 消息 到 它们 的 每 个 结 点 ， 层 号 改 
成 现 有 层 号 加 一 。 若 开始 时 TD(S) > ID(s), WM u BT, 的 根 结 点 路 径 上 的 父子 关系 其 
倒 过 来 ， 且 4 的 父 结 点 是 v; 否则 ， 将 v 到了。 的 根 结 点 路 径 上 的 父子 关系 类 倒 一 下 ， 
B.» 的 父 结 点 是 x。 


5.6.3 算法 的 复杂 性 分 析 及 正确 性 证 明 

定理 5.9 算法 5.8 最 终 会 结束 。 

证 明 ”在 算法 5.8 中 ， 与 每 个 结 点 vez 关联 的 边 分 为 三 类 : 无 用 边 ， 树 边 ， 未 检测 边 。 

算法 初始 化 时 ， 整 个 网 络 G(V,E) 的 所 有 边 都 是 未 检测 边 ， 随 若 计 算 的 进度 ， 未 检测 边 就 

渐渐 地 减少 了 ， 这 些 减 去 的 边 分 别 划 妇 为 树 边 和 无 用 边 类 中 。 结 果 是 ， 在 每 个 超 结 点 内 ， 

当 一 个 树叶 结 点 发 现 自己 已 没有 未 检测 的 边 时 ， 它 立即 向 父 结 点 发 送 “ 计 算 终 止 ” 的 消 

息 ， 当 一 个 非 叶 结 点 〈 或 称 内 部 结 点 ) 收 到 所 有 儿子 发 送 来 的 消息 都 是 “计算 终止 ”时 ， 

若 它 自己 也 找 不 出 未 检测 边 ， 它 就 向 父 结 点 (车 存 在 的 话 ) 发 送 “ 计 算 终止 ”消息 ， 最 终 

的 未 检测 边 集合 将 成 为 空 集 ， 此 时 根 结 点 将 州 道 它 的 所 有 几 子 及 它 自 己 都 没有 未 检测 边 

时 ， 它 向 整个 树 结 点 发 “终止 轨 行 ”消息 、 算 法 终止 。 

定理 5.10 在 基于 异步 通信 的 分 布 式 计 算 模 型 上 ， 找 出 一 个 加 权 的 无 向 连通 

图 G(V,E), I| o n. |E] = 严 的 最 小 生成 树 的 分 布 式 算法 5.-8， 其 通信 复杂 性 为 Om 

十 nlogn)， 时 间 复 杂 性 为 O(nlogn). 

证 明 ”很 显然 ， 在 任何 计算 MST 的 分 布 式 算法 中 ，G(V,8) 中 的 每 条 边 至 少 要 搜索 一 

次 .因此 任何 MST 分 布 式 算法 的 通信 复杂 性 下 界 是 Q(m)， 在 本 节 介绍 的 分 布 式 算法 中 、 

为 了 确定 每 条 边 上 最 多 传送 的 消息 数目 。 我 们 观察 到 ， 算 法 结束 时 有 严 一 全 一 1) 条 边 是 
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无 用 边 ， 在 整个 算法 执行 期 间 ， 每 条 无 用 边 上 只 传递 了 常数 条 消息 ; 另 一 方面 , 在 每 条 树 
边 上 有 可 能 传递 了 O(logn) 条 消息 ， 因 为 最 多 有 O(logn) 个 归并 阶段 ， 而 每 一 归并 阶段 树 
边 上 传递 的 消息 数目 是 一 个 常量 。 故 整个 算法 的 通信 复杂 性 为 O(m + nlogn). 

HFE, O) 是 任何 MST 分 布 式 算法 的 时 间 复 杂 人 性 下 界 。 由 于 在 最 坏 情况 下 ， 在 它 的 
下 一 个 处 理 机 执行 第 一 步 之 前 ， 每 个 处 理 器 至 少 要 执行 一 步 ， 也 就 是 说 ， 处 理 机 初始 化 
过 程 完全 是 顺序 进行 的 、 对 这 个 算法 的 时 间 复杂 性 分 析 的 关键 是 何 时 以 及 怎样 对 层 号 进 
行 修改 ， 本 节 算法 是 仅 当 具有 相同 层 号 超 结 点 归并 时 才 对 层 号 进行 修改 ， 故 整个 算法 至 
多 有 logn1 层 ， 而 每 次 归并 过 程 树 上 操作 时 间 至 多 为 n — 1。 故 整个 算法 的 时 间 复 杂 性 
为 O(nlogn). 


5.6.4 ”其 它 改进 的 分 布 式 MST 算法 
Chin WAT? 曾 对 算法 5.8 进行 了 改进 ， 在 通信 复杂 性 不 变 的 前 提 下 ，. 给 出 了 一 

个 O(nlog m? 时 间 复杂 性 的 算法 。 他 们 为 了 对 超 结 点 内 的 结 点 数目 进行 更 准确 的 合计 ， 
使 用 了 一 个 较 居 号 更 准确 的 指示 器 ， 这 个 指示 器 常常 及 时 地 反映 超 结 点 所 含 结 点 数目 的 多 
D. 应 该 看 到 : 算法 5.8 用 层 号 估 讨 超 结 点 所 含 结 点 的 数目 ， 仅 仅 是 一 个 下 界 ， 实 际 上 一 
个 超 结 点 所 含 结 点 数目 可 以 远 远 大 于 这 个 下 界 . Alt. 4 level_number(S’} 
>levelnumber(S) 时 ， 在 5S 与 $ 归 并 之 前 ， 让 S' 等 待 也 许 是 没有 必要 的 .改进 的 算法 
则 经 常 润 察 超 结 点 所 合 结 点 数目 的 实际 大 小 ， 及 时 更 新 苦 号 以 反映 超 结 点 的 真实 情况 ， 所 
以 他 们 获得 了 一 个 时 间 复 杂 仁 为 O(mog " n) 的 改进 算法 . 

最 近 Awerbuch 进一步 地 把 时 间 复杂 性 改进 到 O(n)", A II EES ER 
地 反映 超 结 点 实际 所 含 结 点 数目 ， 在 每 一 归并 阶段 ， 若 检测 到 一 个 超 结 点 的 层 导 了 小 于 这 
个 结 点 所 会 的 结 点 个 数 = 的 对 数 ， 则 这 个 超 结 点 的 层 号 立即 变 为 Logai d ， 


5.7 小 结 


本 章 着 重 介绍 了 求解 图 论 上 一 个 极其 重要 的 基本 问题 一 一 最 小 生成 树 (MST) 问题 的 
许多 并 行 算法 。 这 些 算法 主要 有 : 著名 的 Solin 算法 在 SIMD -- CREW PRAM 
上 、SIMD 二 维 网 孔 上 以 及 在 MIMD 共享 存 贮 模 型 上 的 并 行 化 实现 算法 ; Bentley 的 树 
机 上 MST 算 法。 同时 还 介绍 了 基于 SIMD — CREW PRAM 上 的 图 更 新 维持 MST 性 质 
的 MST 更 新 算法 ; 最 后 介绍 了 分 布 式 计算 模型 上 的 MST 算法 。 

TX MST 并 行 算法 的 研究 ， 一 直 受 到 人 们 的 高 度 重视 ， 现 已 取得 了 不 少 成 果 。 参 见 
# 5.1. Chin 等 人 以 及 Tsin 等 人 基于 Sollin 算法 及 Hirschberg 顶点 倒塌 的 思 


注 @ log’ n= min(i |loglog~+loga < 1] 
bt 
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18. XESIMD — CREW PRAM 上 ， 分 别 建议 了 O(log n) HII]. O(n? /log 站 处 理 
器 WA, Kucera 基于 Kruskal 算法 ， 在 SIMD — CRCW PRAM 上 ， 建 议 了 一 
个 O(logm) lit ls]. O(mn*) 处 理 器 的 算法 ”，Nath 等 人 基于 Sollin 算法 。 在 SIMD 
一 EREW PRAM 上 ， 给 出 了 O(log’n) MI. O(n” /logn) 处 理 器 的 算法 中。Kwan 等 
人 则 在 SIMD -CREW PRAM .E, EET SLAY MST 算法 ， 他 们 分 别 对 Sollin 算 
He Prim — Dijkstra 算法 以 及 了 ruskal 算法 进行 了 并 行 化 ， 最 后 得 出 算法 复杂 性 分 别 
为 O(mlogn / p) 时 间 、0{p) 处 理 器 (p < m/ logn), O(mlogn / p) HI. O(p) 处 理 
器 (plogp < miogn / n) 以 及 O(mlogn / p) HTT]. O(p) 处 理 器 (p < logn)”， 在 互连网 络 
HL, Doshi 等 人 利用 分 而 治之 策略 以 及 数据 归 约 技术 ， 在 SIMD 一 维 线性 阵列 上 给 
WT O(n" / p) UT. O(p) 处 理 器 的 算法 (1 < p m)", Yeh 在 树 机 上 给 出 了 O0 / p) 
WS. O(p) 个 处 理 器 的 算法 四。Awerbuch 基于 洗 牌 网 络 旦 每 个 处 理 器 允许 写 冲突 ， 给 
出 了 一 个 O(log”n) tH. O (n^) 处 理 器 算法 中 。 基 于 树 网 结构 ，Nath 等 人 曾 建 议 了 一 
^F O(log’ n) ifi, O(n?) 处 理 器 算法 而 后 来 Huang 则 给 出 了 一 个 0(n”/p) 时 
E. O(p) 处 理 器 的 算法 (p & n^ / logn)", Hambrush 在 二 维 网 北上 曾 给 出 一 个 O(n) 寺 
Wl Om?) 处 理 器 算法 中 ;最近 Mages 等 人 基于 二 维 网 孔 这 种 特殊 结构 ， 证 明了 找 图 
的 MST 等 价 于 找 一 个 顶点 为 根 的 至 各 顶点 的 最 短路 径 ， 给 出 了 一 个 0(n) EL. O(n’) 
处 理 器 的 算法 下。 关于 MST 更 新 问题 ， 最 近 Jung 等 人 在 SIMD — CREW PRAM E, 
BAT O(logn) HM. O(n / logn) 处 理 器 的 最 优 算法 由， 基于 MIMD 紧 看 合 异步 共享 存 
贮 模 型 ，Deo 等 人 曾 对 Sollin 算法 、Prim — Dijkstra 算法 以 及 Kruskal 算 法 进行 了 并 行 
化 ， 最 后 他 们 得 出 了 Solin 算法 最 容易 并 行 化 的 结论 ""。Yoo 也 基于 这 种 异步 共享 存 贮 
模型 ， 设 计 了 一 种 适合 于 并 行 计算 的 数据 结构 一 一 并 行 堆 结构 ， 并 引信 了 软件 流水 线 概 
& Xi Kruskal 算法 进行 了 并 行 化 ， 给 出 了 一 个 Om) 时 间 、0(logm) ARAA". d 
近 作者 基于 SIMD — CREW. PRAM 及 SIMD — CRCW PRAM， 给 出 了 与 MST RE 
的 更 新 相关 的 另 一 个 问题 一 一 找 天 个 MST 的 并 行 算法 中。 在 这 两 种 模型 上 ， 算 法 分 别 
9% O(log’n X Klogn) HE, O(n’) 处 理 器 及 O(Klogn) HI), O(n?) 处 理 器 ， 

有 关 基 于 异步 通信 的 分 布 式 计算 模型 上 开发 的 MST 算法 已 取得 了 一 些 成 果 ，Dalal 
从 维护 MST 角度 出 发 曾 建议 了 另外 一 个 MST Seah, Humblet 曾 考虑 有 向 连通 
图 的 有 向 MST RE Spira 曾 对 MST 分 布 式 算法 的 通信 复杂 性 进行 了 详细 的 分 
Vi; 另外 Parker 等 人 也 从 维护 MST 角度 出 发 建议 了 另 一 个 分 布 式 算法 中 


值得 一 提 的 是 ，Gallager 等 人 建议 的 MST 分 布 式 算法 还 具有 方法 学 上 的 意义 ， 
Ramarao . 曾 利用 这 种 设计 分 布 式 算法 的 思想 设计 了 许多 分 布 式 算法 ML. 
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表 5.1 并 行 最 小 生成 树 算法 


年 份 | 作 者 方法 LEE! 时 间 复杂 性 | 处 理 器 复杂 性 备注 
1982 | Chin A" Solin | SIMD-CREW PRAM en) ow) | 
1982 Kucera! Kruskal | SIMD-CRCW PRAM OGogm) Olm’) 

1982 | Nath 和 Muheshwari™ Sollin SIMD-EREW PRAM O(log!n) O(n? / logn) 
1983 Yoo! Kruskal | MIMDEHMERAJUE Olm) OGogm) 
1983 | Nath AP Sollin SIMD-~ 树 网 O(log'n) on) 
1984 |  Tsin HI Chin"™ Solin | SIMD-CREW PRAM |  O(og'm  |O(s'/log'm 
Sollin P&m/logs 

1984 | Kwan #l Ruzzo?! Prim—Dijksteal SIMD-CREW PRAM | O(mlogn/ p) O(n)  HoBp& miogn / a 

Kruskal PEiogn 
1985 Huang | SIMD 树 网 | O(n / p) OW) | p& v / login 
1987 | Doshi i Varman?“ | SIMD 一 维 线性 阵列 O07 p op | l€ pea 
1987 | Awerbuch 等 人 P9 SIMD AP his Otog) ow) 
1987 | Maggs 和 Poltkin™" SIMD 二 维 网 扎 Oin) On) 
1988 | Jung #1 Mehthomp SIMD-CREW PRAM OQogn) O(n/logn) | MST 更 新 
1990 | 唐 策 善 和 尖 维 发 FI SIMD-CREW PRAM | Ollog*atkiogst) | O(n) Re PRAM 

| SIMD-CRCW PRAM | Ollegn) | O6 ] 


说 明 : n 是 图 的 顶点 数 ; om ALAND p ARAE; kR ki MST. 
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第 六 章 ”最 短路 径 的 并 行 算法 


在 运输 网 络 或 通信 网 络 中 ， 最 短 略 径 问题 有 着 极其 重要 的 应 用 背景 。 本 章 介绍 两 类 最 
短路 径 问题 的 并 行 算法 :.(1) 在 一 个 网 络 图 中 . 寻找 从 一 个 指定 顶点 到 其 它 所 有 顶点 问 的 
最 短路 径 一 单 源 最 短路 径 问题 的 并 行 算法 ; (2) 在 一 个 网 络 图 中 ， 寻 找 每 一 对 顶点 间 的 
最 短路 径 一 所 有 项 点 对 的 最 短路 径 问题 的 并 行 算法 。 在 一 个 有 向 网 络 图 G (V. E) 中 ， 
只 要 不 存在 负 权 环 ， 图 中 边 的 权 值 可 以 是 正 数 也 可 以 是 负数 。 车 存在 负 权 环 ， 则 将 使 得 对 
某 些 顶点 间 的 最 短路 径 的 定义 没有 意义 。 在 一 个 无 向 网 络 图 中 ， 边 是 无 方向 的 ， 遍 历时 可 
以 沿 着 边 所 连接 的 两 个 顶点 中 的 任 一 个 穿 过 该 条 边 ， 但 边 的 权 值 不 能 为 负 。 


61 单 源 最 短路 径 算法 


单 源 最 短路 径 问 题 是 指 求 从 一 个 指定 的 顶点 8 到 其 它 所 有 顶点 i 之 间 的 距离 dist(i) 为 
最 短 的 路 径 ， 其 中 sev AWA, ieV Biss. 假定 图 CVE) 是 一 个 有 向 网 络 ， 其 加 
权 邻 接 短 阵 为 所 ， 且 边 上 权 值 wi,j) >0, LjeV, V={l, 2, oni. 

著名 的 Dijkstra 算法 ”的 基本 思想 是 : 假定 有 一 个 待 搜索 项 点 表 VL， 初始 化 时 
We dist(s) — 0; dist) oo (iss) VL-«—V. fi. BRA VL = p) 中 选取 这 样 
一 个 顶点 4， 它 的 dist(u) 值 最 小 .将 选 出 的 顶点 为 搜索 顶点 ， 若 <uv> ck, iff 
H dist(u) + w(u,v) <dist(y)， 则 更 新 dist) 为 dist(u) + w(u,v), ESI VL = 中 时 算法 终 
JE. 


算法 6.1 DIJKSTRA ALGORITHM (SISD) 

输入 : PRRRBERW, HR i j 之 间 无 边 连 接 时 w 人 fb 门 = oo. Bw(ii) — 0; 
输出 : dist(l:m)， 其 中 dist( 站 表示 顶点 到 顶点 i 的 最 短路 径 (1 ix n). 
begin 

Z * 初始 化 * / 
(1) dist(s)—0; 
(2) for ic 1 to. n do ` 

if izs then dist(i)< oo endif 

endfor ; 
3) VL—-V; 
(4) for i- 1 to n do / * RRAIER + / 
(5) find a vertex ue VL, such that dist(u) is minimal ; 
(6) for each («uv > €E) A (veVL) do 

f dist(u) + w(u,v) < dist(v) then dist(v) — dist(u) + w(u,v) endif 
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endfor , 
(7) VL—VL-Íul 
endfor 
end 


Paige 等 人 "基干 SIMD — EREW PRAM， 对 算法 6.1 进行 了 并 行 化 。 为 了 简化 讨 
论 起 见 ， 约 定 顶 点 i MEA d, (i) (Li n). 具体 算法 并 行 化 如 下 : 


算法 的 第 (2) 步 的 实现 为 : 每 个 处 理 器 分 派 Tn / pl 个 顶点 ， 最 后 一 个 处 理 器 分 派 
- Tav 门 "(p 一 了 个 项 点 ， 每 个 处 理 器 对 所 分 派 的 顶点 顺序 地 冉 值 ; 第 (3) 步 其 实 是 对 
数组 VI 赋值 ， 同 第 (2) 步 类 似 处 理 ， 第 (5) 步 实现 如 下 : 首先 每 个 处 理 器 检测 自己 内 
部 fxn/ pl 个 顶点 的 最 小 值 ， 然 后 p 个 处 理 占 合作 ， 并 行 计算 p 个 最 小 值 中 的 最 小 值 ; 
第 (6) 步 实现 如 下 : 首先 将 顶点 4 广播 到 所 有 的 处 理 器 中 ， 假 定 u 是 送 人 处理 占 i 的 B) 
单元 中 (1 < ig p)， 则 实现 广播 的 算法 为 : 


算法 6.2 BROADCAST 
WA: 数据 u (存放 在 单元 B(1) 中 ) ; 
输出 : 将 4 广播 到 数组 B 的 所 有 单元 中 去 。 
begin 
(1) BO) a; 
(2) for i—0 to flogp! — 1 do 
(3) for each j: 2'+1< j& 2/* pardo 
BG) BU 2) 
endfor 
endfor 


end. 


然后 每 个 处 理 器 检查 所 有 过 cur > eE， 其 中 veVL， 且 » 是 本 处 理 句 的 顶点 . 

定理 6.1 在 SIMD - EREW PRAM L. 求 一 个 有 向 连通 加 权 图 G(V,E). |V| =n 的 单 
WRAHA 的 算法 6.1 的 并 行 化 实现 ， 涡 O(n? / p+ nlogp) NR, Olp) 处 理 器 (1 < p 
xn. 

EAA Dijkstra 算法 并 行 化 的 每 一 步 的 复杂 性 分 析 如 下 : 第 0) 2588 OM) 时 间 在 单个 处 理 
处 理 器 边 ” 源 (2) 和 第 (3) JERE O(n / p) 时 间 、0O(p) 个 处 理 器 ; 第 (5) BB O(n p 
十 logp) ATI. Olp) 处 理 器 ; 第 (6) 步 广 播 希 0(ogp) 时 间 、O(p) 处 理 器 ; 然后 进行 比较 
更 新 ， 需 0(d (u)/ p) ERI. Op) 处 理 器 ， 故 第 (4) 步 需 


O(n(n / p+ 2logp) + È Id, 007 p)- O(n’ / pt nlogp + m/ p n) 
P 


BE]. O(p) 处 理 器 。 因 此， 整个 算法 种 O(n? / p+ nlogp) BE]. O(p) 处 理 器 (i < p 
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<n). 

Paige 等 人 还 把 上 述 在 SIMD — EREW PRAM 上 的 算法 推广 到 SIMD 
一 CRCW PRAM 上 ， 在 这 种 计算 模型 上 用 p 个 处 理 器 对 个 元 素 进 行 二 元 结合 运算 ( 
如 求 最 小 值 运算 ) 仅 需 O(n / p+ loglogp) 时 间 ”， 为 此 不 难 推 得 : 
推论 6.1 在 SIMD — CRCW PRAM 上 ， 求 一 有 向 加 权 图 G(V,E), |V| n 的 单 源 最 
短路 径 需 O{nloglogn) 时 间 和 O(n / loglogn) 处 理 器 . 
证 明 ”类 似 定理 6.1 的 证 明 ， 不 再 区 述 ， 


62. 所 有 顶点 对 的 最 短路 径 算法 


设 一 个 有 向 图 GOZ,E). IV] 9 的 如 权 邻 接 矩 阵 为 W, H w(i,j) 表示 边 GJ) 的 长 
BE, 3S UBI j AREETA WY., W w(i, 站 为 0，1 < i jan i jev. BME A ALB 
的 各 C = AB 定义 为 : 
C(i, j) = min[w(i, k) + w(k,]) | k 9 5,2, n] 
令 最 短路 径 矩 隆 为 D， 则 Floyd 算法 如 下 : 


算法 63 FLOYD ALGORITHM (SISD) 
输入 : AAG (VE) AMR W = {w h iP eV: 
输出 : MATAA RERED = {dt bj eV. 
begin 
D DoW; 
(2) for ke1 to n do 
(3) for i+ l to n do 


(4) for j—1 to n do 
5) dli j ) - minfd(i,/ ), Ak) + d(k,j Yy 
endfor 
endfor 
endfor 
end. 


对 算法 63 人 们 很 容易 并 行 化 ， 当 使 用 p< n” 个 处 理 器 时 ， 我 们 可 以 对 算法 中 的 
588 (0) 步 和 第 (3) 到 (5) 步 并 行 化 . 
引 理 6.1 在 SIMD — CREW PRAM 上 ， 求 一 个 有 向 加 权 图 G(Y,E)，|Yi=n 的 所 有 项 
点 对 的 最 短路 径 ， 算 法 6.3 的 并 行 化 实现 ， 需 O(n / p) IIS. O(p) 处 理 器 (1 < p<n’), 
证 明 ”对 算法 6.3 的 并 行 化 ， 数 组 DOR n^ AER BOR n^ 个 元 素 赋 值 需 O(n”/ p 
MI. O(p) 处 理 器 ; 第 (3) 步 到 (5) 步 有 n? 个 4G) 要 计算 ， 对 这 ?个 数 进行 检查 
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38 0(n^ / p) BEI. O(p) 处 理 器 ; 而 且 第 (3) 到 {5) 步 执行 了 nn 次 ， 故 整个 算法 
38 O(n? DRR, OMARO Spn) 

事实 上 ， 算 法 6.3 BEARER n 次 。 为 此 ， 求 所 有 顶点 对 的 最 短路 径 并 行 算法 亦 
就 变 为 矩阵 相 乘 的 并 行 算法 。 


令 G(V,E) 的 最 短路 从 矩阵 为 了， 同时 令 OU), SeRTUS i AK /之 问 的 一 条 最 
短路 径 , 且 这 条 路 经 至 多 经 过 了 2 个 中 间 n. 因 G PORES, 所 
Udi e 4 "" (,j). BR a" Gj) = w(i,j)， 在 并 行 环境 里 ， 对 所 有 1，j 和 同一 个 
f&, dhap 同时 进行 计算 (< ij<n, 0<k< Hogni). 


算法 6.4 ALL VERTICES SHORTEST PATH ALGORITHM 
输入 : ARGV, EG e tA dA ME = {wb hj ev; 
输出 : MATET REED = fd yb ij eV. 
begin 
/ + HEU / 
(1) for cach i, j: 1X i,j& "» pardo 


d" G, j) - wli, i) 


endfor ; 
/ * 并 行 计算 所 有 项 点 对 的 最 短路 径 * / 
(2) for k—1 to llognl do 


3) for each i,j]: i €i, 42 <n pardo 
(4) BG, L1) c a^ G, D) e d^" Q, p); 
6) d", fye min(a^ "i, j), Bü, 51) «l«n) 
endfor 
endfor 


end. 


在 给 出 上 述 算法 的 复杂 性 分 析 之 前 ， 首 先 我 们 证 明 上 述 算法 的 正确 性 . 
引 理 6.2 EMAC ABS RE W MUS DU 之 后 ， 每 次 结果 和 矩阵 需 自 乘 Nog KETER 
fp". 
证 明 ”这 里 采用 归纳 法 证 明 , 设 4 (i,j) 表示 顶点 i 到 硕 点 /之 间 至 多 经 过 2* 个 中 间 顶 
点 的 最 短路 径 。 当 k= 0 时 ，D”= 所 ， 命 题 显然 成 立 。 

归纳 假定 : el<ket, Q d G 表示 顶点 1 到 顶点 j 之 间 至 多 经 过 2' 个 中 间 硕 点 
的 最 短路 径 。 在 算法 6.4 的 第 次 循环 时 ， 

dP (i, j) - mintd ^" (i, j), BG AD 1 <i <n} 

3540, Nod, 7)， 则 表示 顶点 1 到 顶点 /之 间 的 最 短路 径 不 超过 28& ?个 ; 若 存 
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ERNIS <n), Gn 

d® G, N= B, 1) dA" G, 1) c a^ Qj) 
由 归纳 假定 可 知 : MAG AA, 之 间 至 多 有 2& "个 中 间 顶 点 ， 顶 点 如 到 顶点 j 之 间 
E438 27" 个 中 间 顶 点 ， 故 顶点 ;到 顶点 /之 问 至 多 有 2* 个 中 间 顶 点 ， 又 因为 图 G 的 
最 长 路 径 至 多 有 一 1 个 中 间 顶 点 ， 所 以 k < flog. HIHUEBE D® HR rlogn1 次 能 
xn p^. 
定理 6.2 算法 6.4 能 正确 地 计算 出 所 有 顶点 对 的 最 短路 径 、 
证 明 由 引 理 6.2 直接 推 证 ， 
定理 63 在 SIMD-CREW PRAM 上 ， 求 一 个 有 向 、 无 负 环 的 加 权 图 G(V,E), =n 
的 所 有 顶点 对 的 最 短路 径 算法 6.4， 需 Oloa. OPR. 
证 明 从 算法 64 可 知 ， 第 (0) 步 需 O(D 时 间 、0O(m) 处 理 器 ; 第 (3) 到 (5) 步 需 OG? LB 
器 ， 且 第 (4) 步 需 Q(T) 时 间 ， 第 (5) 步 需 O(logm) 时 间 ; 由 第 (2) 步 可 知 ， 第 (3) 到 (5) 步 项 执 
fi T Jogn1 次 ， 因 此 算法 6.4 B O(log n) TA], O( y AERERR. 
推论 6.2 在 SIMD-CREW PRAM 上 ， 求 一 个 有 向 、 无 负 环 的 加 权 图 CVE) [Vian 
的 所 有 顶点 对 的 最 短路 径 需 OClog’n\IN TH]. O(n? /logn) 处 理 器 中. 
证 明 在 算法 6.4 的 第 (3) 到 (5) 步 采用 分 组 技术 ， 每 个 处 理 器 每 次 顺序 处 理 至 多 riogn1 个 
元 素 。 其 余 证 明 类 似 定理 6.3. 
推论 6.3 在 SIMD-CRCW PRAM 上 ， 求 一 有 向 的 、 无 负 环 的 加 权 图 GVA), Vin 
的 所 有 顶点 对 的 最 短路 径 具 需 O(logn) 时 间 、0O(n 处 理 器 
证 明 采用 4.1 节 的 Kucera FA, JBPEXEEUST IE O(1) 时 间 内 完成 ， 而 由 引 理 6.2, 
每 次 结果 和 矩阵 必须 自 乘 [logn1 次 ， 故 算法 的 复杂 性 不 难 推 得 


(en 


6.3. 二 维 网 孔 上 的 最 短路 径 算 法 


Guibas A" 曾 在 nxn 个 处 理 器 的 二 维 Systolic (心动 ) 网 孔 上 给 出 了 一 个 计算 
图 G(V,E) 的 传递 闭 包 算法 ， 这 一 算法 的 重要 应 用 背景 就 是 求 有 向 加 权 图 的 所 有 顶点 对 的 
最 短路 径 . 令 G(V,E) 的 邻接 矩阵 为 4。 


算法 6.5 TRANSITIVE CLOSURE ON SYSTOLIC ARRAY 
输入 : HORA hese = fa, i jev; 
did FMEA RHEE AEC = (o, cli, 站 存放 在 编号 为 他 站 的 处 理 器 寄存 器 
中 , dev, jev. 
begin 
(1) EEA ERAR. eli, I) ali jh 同时 a(i, j) 有 两 个 副本 ， 一 个 作 水 
—91— 


FB, dta" gh 3 TER LBD, HANG, D): 
(2) 在 某 一 时 钟 节拍 ， 若 元 素 a (i,k) Rak, j) EARR A, j ORES, 
此 时 这 全 处 理 器 做 : 
@ Bia’ Rk—j'. Ma Gwe et’, j^); 
G) #k=r Rjj'. Walk, je c0.) ^); 
(Gi) e, Yc elt, j Va i k) ^ a" (k, 1; 
(3) 数据 按 图 6.1 所 示 方 向 流动 ， 直 到 a (n, nypa” (n, 站 穿 过 整个 网 孔 为 止 


end. 


8 bu 由 此 可 知 : 从 a CL DE A EL SI 
n,n) 离开 网 乳名 OCT TI. 

ba c8 ^. 定理 64 在 SIMD Heb ahl 4L 
ba 58 ou Ou d. MADRE a 的 传递 闭 包 ， 
ba by hn 算法 65 3b OM. OG Mb 
"an 8 
PIE P 
推论 64 在 SIMD 二 维 心动 网 孔 
上 ， 求 一 个 有 向 无 负 环 的 加 权 图 中 所 
有 项 点 对 的 最 短路 径 ， 常 Omit 
Bj. O( bas. 
证 明 ”把 算法 6.5 中 的 4 I d 
BERE 所 ，C 为 所 有 项 点 对 的 最 短 

图 61 FTL LA Riese PRP ME, FOR 6.5 PROS 

(ii) ft: 

ej” yeominfe(, jh WG, kyew?(k, p) 
则 得 到 的 算法 就 是 一 个 求 所 有 项 点 对 的 最 短路 径 的 算法 ， 且 这 样 的 转换 并 不 影响 算法 的 复 
杂 人 性， 故 推 论 得 证 ， 


6.4 MIMD 共享 存 贮 模型 上 的 最 短路 径 算法 


Deo 等 人 ”基于 MIMD 紧 耦 合共 享 存 贮 模型 ， 实 更 了 Moore 算法 的 并 行 化 ， 为 了 


介绍 他 们 的 算法 ， 我 们 先 介绍 Moore 单 源 最 短路 径 算法 ”， 

在 Moore 单 源 最 短路 径 算法 中 ， 设 源 点 为 se， 从 * 到 其 它 各 顶点 的 最 短路 径 长 度 
用 一 个 一 维 数组 dist FR. AEH dist(s) = 0, dist(v) e oo, vs. veV. Moore 算法 
i] Dijkstra 算法 不 同 之 处 是 : 将 Dijkstra 算法 中 的 待 搜索 顶点 表 蔡 换 成 待 搜索 队列 、 算 法 
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FOUN, DPR GHA s. DUESEUORSEREIUREAPUAEZS , MEA SG PT TEL AAI «P 
移出 作为 本 次 搜索 的 项 点， 然后 检查 u MATA <u, >EE. A dist(u) + w(u) 
<dist(y)， 则 此 时 找到 了 一 条 从 s 到， Pa SEATS, SE dist(v) 等 于 dist(u) + wur). 2 v 
不 在 待 搜索 队 询 中 ， 风 把 » 加 入 到 队列 的 队 尾 .如 此 重复 进行 ， 直 到 整个 待 搜索 队列 空 
时 ， 算 法 终止 。 下 面 我 们 给 出 单机 上 的 Moore 算法 . 


算法 6.6 MOORE ALGORITHM (SISD) 
输入 : AARG, Ey AAR EE = fw}, ij VS 
输出 : 从 源 s 到 所 有 其 它 顶 点 i GAs) RMB Adis’), ieV. 
begin 
(1) for ie 1 to n do /初始 化 * 7 
call INITIALIZE(i) 
endfor ; 
(2) insert s into the queue ; Z =A s 到 队列 中 * / 
(3) while the queue is not empty do 
(4) call SEARCH 
endwhile 
end. 
procedure SEARCH ; 
begin 
(4.1) dequeue vertex u; Z * 从 队列 中 莽 去 顶点 4* / 
(4.2) for each edge (u,v)e E do 
(4.3) new. dist — dist(u) + w{u,v) ; 
(4.4) if new. dist « dist(v) then dist(v)« new. dist endif; 
(4.5) if y is not in the queue then enqueuc vertex v endif 
endfor 
end. 


其 中 ， 过 程 INITIALIZE 是 做 初始 化 工作 ， 即 是 做 : dist(s) - 0; dist(v) e- oo 
(W#s,veV); queue, 
现在 我 们 用 一 个 具体 例子 来 说 明 算法 6.6 船 执行 过 程 ， 如 图 6.2 所 示 ， 


6.4.1 算法 的 基本 原理 


Dco 等 人 的 算法 是 算法 6.6 的 并 行 化 ， 直 观 上 讲 、 算 法 6.6 有 两 种 明显 的 并 行 化 方 
法 ， 第 一 种 方法 是 对 SEARCH 过 程 的 第 (2) 到 (5) 步 并 行 化 ， 任 何 一 个 顶点 ， 可 能 存在 有 
九条 射出 边 ， 这 些 射出 边 可 以 并 行 地 检查 ， 第 二 种 方法 是 对 算法 的 第 (3) 到 (4) 步 的 while 18 
环 并 行 化 ， 在 算法 执行 过 程 中 ， 任 何 时 候 都 可 能 有 许多 顶点 在 队列 中 ， 因 此 ， 每 次 就 可 能 
检查 多 个 顶点 的 射出 边 。 上 述 两 种 并 行 化 方法 ， 究 竟 嘱 一 种 更 好 呢 ? 我 们 完全 有 理由 赞成 
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使 用 第 二 种 方法 。 首先 ， 第 二 种 方法 能 产生 大 粒度 (Larger Grained) 任 务 进程 .根据 粒 


度 尺 寸 定理 09， 它 很 可 能 产生 好 的 加 速 出 ; 
次 ， 第 一 种 方法 的 并 行 度 受到 搜索 顶点 的 射 
Hus RMA. AA GEBEN, 
则 其 活动 的 进程 数 就 少 。 


642 ”算法 的 形式 化 描述 


我 们 用 产生 大 粒度 的 、 适 合 于 稀 朴 图 的 第 
二 种 方法 来 描述 并 行 算法 。 首 先 队 列 用 源 点 初 
始 化 .然后 创建 了 许多 异步 进程 。 每 个 进程 都 
执行 下 列 步 又 : 即 从 队列 中 删除 一 个 顶点 ， 检 
查 被 蓟 除 硕 点 的 射出 边 ， 将 已 发 现 的 、 有 更 短 
路 径 的 顶点 加 入 到 队列 中 ， 算 法 6.6 的 第 (1) 步 
采用 伪 调 度 (Prescheduling) 方 法 很 容易 并 行 
化 .第 (3) 步 和 (4) 步 的 while 循环 必须 做 适当 的 
修改 ， 使 得 能 反映 并 行 执行 SEARCH 过 程 时 
许多 异步 进程 的 存在 性 。 显然 ， 当 一 个 进程 发 
现 队 列 为 空 时 ， 这 个 进程 就 终止 执行 是 不 适当 
的 .因而 必须 采用 更 复杂 的 办 法 .在 下 面 描述 
的 算法 中 ， 我 们 将 两 个 变量 联合 使 用 ， 以 便 决 
定 还 有 没有 工作 要 做 ， 第 一 个 变量 是 数组 变量 
waiting， 它 记 住 哪 一 个 进程 上 处 在 等 待 状态 
(等 待 工作 去 做 ); 第 二 个 变量 是 布尔 变量 
halt， 仅 当 队 列 为 空间 所 有 进程 处 于 等 待 状态 
HAR, H INITIALIZE 过 程 置 数组 waiting 
中 的 每 一 个 元 素 为 假 。 

SEARCH 过 程 也 必须 作 适当 的 修改 . 因 
为 对 队列 的 插入 ， 删 除 操作 不 是 原子 (Atomic} 
操作 ， 所 以 当 一 个 元 案 加 到 队列 中 去 或 从 队列 
中 删除 一 个 元 素 时 ， 必 须 给 队列 上 锁 。 其 次 ， 
在 一 个 进程 将 刚 发 现 到 v BA new. dist 与 当 
前 的 最 短路 径 dist() 比 较 之 前 ， 变 量 dist(y) 必 
须 上 锁 ， 和 否则 ， 两 个 进程 有 可 能 同时 修改 
dist(w)， 得 到 的 结 朵 是 不 正确 的 。 如 图 6.3 所 
示 。 最 后 ， 考 一 个 进程 发 现 队列 为 空 时 ， 则 置 
数组 waiting 中 的 相应 元 内 为 真 。 若 进程 1 处 
在 等 待 状态 ， 则 它 检查 每 个 进程 是 否 都 在 等 待 
状态 。 如 凡 每 个 进程 都 在 等 待 ， 那 么 hall 值 置 
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62 Moore 的 单 源 最 短路 径 算法 示例 


RE. 注意 : 在 进程 1 REAR TSR, RE BL. 


G) (7) 
dist (9) 的 当前 值 进程 1 进程 2 
28 从 队列 中 删 去 顶点 4 从 队列 中 删 去 顶点 7 
28 考虑 边 (4.9) 考虑 边 (7.9) 
28 new__dist+-22 new. dist«-24 
28 new. dist« dist (9) | mew. dist < dist (9) 
28 dist (9}-22 . 
22 dist (9)+-24 
24 . 


图 6.3 PHBR. RAAE Be PR RE dist(j 值 引出 的 错误 


算法 6.7 PARALLEL ALGORITHM FOR SHORTEST PATH 
MAL ODE GE ME ISAXABSAEAE = {wi} b P evi 
输出 : 从 源 s 到 其 它 所 有 项 点 i HRM dis), iss. d eV. 
begin 
(1) for each i: 1<i< p pardo 
for j-i to n step p do / * #738404 / 
call INITIALIZE(j) 
endfor 
endfor ; 
(2) enqueue s ; A A MBS PRs / 
` (3) halt false ; / * 置 布 尔 变 量 为 假 * / 
(4) for cach i: 1 <igp pardo 
(5) while not halt do 
(6) call SEARCH(i) 
endwhile 
endfor 
end. 
procedure SEARCH(i) ; 
begin 
(6.1) lock the queue; / WF Ed y 
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(6.2) if the queue is empty / * 队列 空 时 置 相 应 的 元 素 为 真 * / 
(6.3) then waiting(i)+ true ; 


(6.4) dil o / * 进 程 1 等 竺 时， 检查 其 它 进程 是 否 在 等 待 * / 
then halt e waiting(2) and waiting(3) and** and waiting(p) 
endif ; 
(6.5) unlock the queuc / + 队列 开锁 * / 
(6.6) else dequeue; / * ABS) PRM Hue / 
(6.7) waiting(i) +- false ; 
(6.8) unlock the qucue ; 
(6.9) for each edge <zy > €E do / * 检查 每 条 射出 边 * / 
(6.10) new... dist — dist(u) + w(u.v) ; 
(6.11) lock(dist(v)) ; 
(6.12) if new. dist < dist(v) 
(6.13) then dist(v) - new. dist; — / * ##fnew_dist* / 
(6.14) unlock(dist(v)) ; 
(6.15) if y¢queuc 
(6.16) then lock the queue ; 
(6.17) enqueue y; 
(6.18) unlock the queue 
endif 
(6.19) else unlock (dist(v)) 
endif 
endfor 
endif 
end. 


值得 指出 的 是 : 虽然 创建 更 多 的 进程 能 降低 整个 算法 的 执行 时 间 ， 因 为 几 个 顶点 的 射 
出 边 可 以 同时 进行 检查 。 但 每 个 进程 对 队列 的 插入 及 删除 需 进行 互 斥 控制 ， 故 最 大 加 速 比 
最 终 还 是 受到 限制 的 。 

车 每 个 进程 维护 一 个 局 部 的 待 搜索 表 , . 插入 和 删除 元 素 都 在 局 部 的 表 中 进行 ， 那 么 进 
程 间 就 不 存在 冲突 了 。 然而 ， 若 这 种 表 的 尺寸 变化 很 大 时 ， 则 让 每 个 进程 管理 自己 的 表格 
会 引起 工作 严重 的 负载 不 平衡 . 一 种 折 变 的 方法 是 : 每 个 进程 插 人 元 素 到 自己 的 局 部 表 
中 ， 然 后 将 这 些 局 部 表 连 接 起 来 形成 一 个 结合 表 。 删除 可 以 这 样 做 : p 个 进程 的 每 一 个 i 
仅 检查 结合 表 的 第 (i-1)* pH 个 元 家 ， 按 这 种 方法 去 作 ， 每 个 进程 所 做 的 工作 就 平衡 了 . 
如 图 6.4 Bros. 
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(b) 每 个 处理 器 陋 p TCR 
图 6.4 ”链接 数组 的 逐 辑 形 式 


链接 数组 (Linked Array) 是 一 种 数据 结构 ""”， 设 计 它 的 目的 是 可 以 将 不 同 尺寸 的 表 
链接 起 来 ， 且 对 表 元 素 的 插 人 和 搜索 可 以 并 行 地 进行 而 不 发 生 冲 突 ， 假定 在 单个 循环 步 
中 ， 每 个 进程 至 多 插入 w TERK. ERAS. ERRAZA p (w+ p) TOURS M 
每 个 进程 有 wt pT, BH w+ p 位置 后 面 的 连续 一 组 元 素 是 进程 下 一 次 循环 时 待 
搜索 的 元 索 ， 如 果 进 程 1<i< p 产 生 了 e, 个 无 素 ， 且 将 在 下 一 次 循环 时 才 会 被 搜索 ， 
那么 ， A(G ~e (wt pt D4 13] (—1)* (w+ pt D) e, MAAK, TK, AG 
-D:(wo pt tte, c1 (1—1) (w+ oti) + p ER EAE —i+ (wtp 
+1) BHA —i+ (w+ pp. 

ETRE, 4MPRRRAN RRR RIN, WA 1<i< pM 
ive. S ep PUR KRE. SRRAMAAT 0， 则 就 是 待 搜索 的 顶点 元 
36 车 检索 到 的 值 小 于 0， 则 这 个 值 是 一 个 指针 ， 处 理 器 立即 检查 指针 所 指 位 置 ， 当 指针 
值 小 于 -pe (w+ p) 时 ， 搜 索 终 止 ， 

过 程 EXAMINE 说 明 一 个 进程 如 何 从 一 个 含有 顶点 元 素 和 指针 的 数组 中 移 去 一 个 元 
&. 


算法 68 EXAMIZATION TO ELEMENTS 
procedure EXAMINE (A, i, p, w); 
/ * 4 是 含 顶点 元 素 和 指针 的 一 维 数 组 ，P 是 进程 数 ， 每 个 进程 含 w 十 p 个 元 素 ， 移 
去 工 中 元 素 * / 
begia 
a) jen 
(2) while j< p(w + p) do 
{3)  ifa(j)«0 then j- —a(j) 
else manipulate vertex whose value is a(7); 
d-j+p 
endif 
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endwhile 
end. 


AA SEAL FPS RUE, (FREER EERE, BRAEDRUEAS EGET AERE EIT MR 
A. 链接 数组 需 分 配 的 空间 大 约 是 每 个 处 理 器 子 表 空 间 的 p 倍 。 算 法 6.6 的 一 个 并 行 划分 
版 本 可 设计 成 使 用 链接 数组 结构 。 在 一 次 循环 中 ， 每 个 进程 有 许多 顶点 将 被 检查 ， 每 个 
进程 将 编辑 它 自己 的 顶点 表 ， 这 些 顶 点 是 到 目前 为 止 已 发 现 的 更 短路 径 项 点 ， 然 后 每 个 
进程 建立 到 下 一 个 进程 的 链 、 在 下 一 次 循环 时 ， 并 行 地 检查 这 些 表 ， 算 法 使 用 了 两 个 数 
组 ， 在 任何 一 次 循环 中 ， 一 个 数组 用 于 读 ， 而 另 一 个 数组 用 于 写 ， 紧 接着 的 下 一 次 循 
环 ， 两 个 数组 的 作用 再 颠倒 过 来 . 


6.5 分 布 式 单 源 最 短路 径 算法 


Chandy 等 人 D? 曾 考虑 了 带 负 环 的 单 源 最 短路 径 算法 。. 本 节 我 们 介绍 这 一 算法 。 已 知 
一 个 有 向 加 权 图 G(Y,E)x V — (1, 2, nl. 3E <i j> CE MR WG, 让 可 以 为 正 ， 也 
可 以 为 负 BIG j 之 间 不 存在 边 ， 则 w(i, j) o. WR wi D = 0, (1 <i, fends Rs H 
源 点 ，s 到 二 的 最 短路 径 为 L,。 若 图 G 中 存在 一 个 负 环 C， 则 C 上 所 有 结 点 i 的 L 为- 
co。 假定 每 个 结 点 ie 知道 其 所 有 射出 边 的 邻接 结 点 和 这 些 射 出 边 上 的 权 值 


6.5.1 算法 的 基本 原理 

算法 基本 上 分 为 两 个 阶段 ， 每 一 个 阶段 开始 时 ， 都 是 源 点 s 作 本 阶段 的 初始 化 工 
作 。 在 第 一 阶段 结束 时 ， 对 每 个 结 点 i 而 言 ， 若 工 , 了 一 ， 则 它 得 到 一 个 有 限 的 最 短路 
径 工 ,。 若 存在 某 个 结 点 J UAA L 二 一 吕 ， 则 在 第 一 阶段 结 束 时 了 自己 并 没有 注意 到 
这 一 点 。 第 二 阶段 的 目标 就 是 通知 所 有 上, = 一 oo 的 结 点 诗 停 下 执行 ， 且 告诉 它们 是 负 环 
可 达 的 结 点 - 

算法 的 第 一 阶段 使 用 了 两 种 消息 ， 即 有 关 最 短路 径 长 度 消息 和 应 答 消息 ， 用 二 元 
组 (1， 站 表示 最 短路 径 长 度 ， 其 中 : 1 是 一 个 实数 ，F 是 结 点 的 编号 。 结 点 i 发 送 一 
^. DISBASUA 它 通知 Mills 到 /存在 一 条 长 度 为 1 的 最 短路 径 ,1 是 这 条 路 径 
上 的 最 后 一 个 中 间 结 点 。 

算法 的 第 二 阶段 使 用 了 "over 2 及 "over - ”两 种 消息 . 若 一 个 结 点 j 确信 它 的 第 一 
PECAR. H L=- 0, JU j NC) 所 有 成 员 发 送 “over — " 消息.“over 一 ” 
消息 的 接收 者 一 旦 收 到 该 消息 后 ， 就 停止 第 一 阶段 的 计算 ， 并 将 “over — “消息 拷贝 到 它 
的 射出 边 的 每 一 个 邻接 结 点 。 当 某 个 结 点 7 第 一 阶段 已 经 完成 ， 但 还 没有 确定 L,=-@ 
Bb. EN (7) 发 送 "over VHE. "over Y 消息 命令 接收 者 停止 第 一 阶段 的 计算 . 
车 “over V 消息 接收 者 在 收 到 此 消息 时 ， 它 已 收 到 所 有 上 应答 消息 ， 则 它 找 贝 “over ?” 到 
每 个 射出 边 的 邻接 结 点 ; 否则， 发 送 "over — " 至 每 个 射击 边 的 邻接 结 点 。 
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652 算法 的 形式 化 描述 

算 涛 用 到 下 面 的 一 些 局 部 变量 : 
d; 到 目前 为 止 ， 结 点 i 收 到 的 最 短路 径 长 度 , 初 值 d, = co (ie 四 
father: 接收 到 4, 的 发 送 者 。 当 d, 二 coins iit, father) = i e Vs 
num, 结 点 宇 发 出 的 销 忘 数 是 ， 即 双 目前 为 止 尚未 收 到 应 竺 的 消息 数目 (fte 记 : 
NG: 结 点 1 射出 边 的 另 一 端点 集合 ，N, (=< ij> eE 


算法 6.9 A DISTRIBUTED ALGORITHM FOR SINGLE SHORTEST PATH 
BA: BPRRICVAN, Q)— (0i j» cE} LAE P iiw, jh 
f=, 2. ww, n. 
输出 : Es MEPS i 的 最 短路 径 L,。 车 i 在 负 环 上 或 从 负 环 可 达 i， 则 工 ， 
— œ, ieV, 
begin 
源 结 点 5 处 的 算法 【第 一 阶段 ) 
初始 化 
a, «0; father(s)-5; 
send(w(s, i), s) to i, for all ieN , (s); 
[QUE 
upon receiving (i, i) message from i. do: 
/ * 车 检测 到 负 环 ， 开 始 第 二 阶段 * / 
if J «0 then terminate phase I and start phase II 
elke send ACK message to node i 
endif ; 
upon receiving an ACK message from j do: 
num, «num, — 1; 


num, -|N 


out 


if num, =0 then terminate phase I and start phase I| endif; 
源 结 点 5 处 算法 (第 二 阶段 ) 
upon receiving (/,i):message from i do: 
if 1 <0 then send-"over —" message to j, for all jeN, (3) 
else send "over ?" message to j, for all JEN, (3) 
endif ; 
RIE RG (He s) ik (R) 
初始 化 
dH wo; father(j)<j; num e0; 


upon receiving (/, i) message from i do: 


1 


if 1«d, 
then if num,»0 then send ACK. message to node father(j) endif; 
father(j) — i; 
d el; 
i 

send (4, wk), J) message to cach k, keN UU) 

Qu 

if num,—0 then send ACK message to father(j) endif 


num e num 4 |N 


out 


ele send ACK message to node i 
endif ; 
upon receiving ACK message from node i do: 
num enum, -—1; 
if num,— 0 then send ACK message to father(j) endif ; 
一 般 结 点 j (j 关 5) 处 算法 (第 二 阶段 ) 


" message or “over ?" message do: 


upon receiving “over — 
if d,& — oo 
then 4, 二 一 co 


” 


send "over — " message to each i, i EN (J) 


out 
endif ; 
upon receiving “over ?” message do: 


if 4d,* — «o then send “over ?" message to cach i, ieN ,, (j) endif; 


end, 


FERME MAFRE AIK 6.9 第 一 阶段 的 
执行 情况 . 图 6.5 是 一 个 吉 权 有 向 图 ， 共 中 结 点 1 为 
源 点 ， 普 先 注 意 ， 册 于 发 送 延 迟 是 任意 的 ， 所 以 网 络 
的 计算 是 不 确定 的 ， 图 6.5 的 四 由 快照 见 表 6.1。 说 
明 如 下 : 
快照 1 结 点 1 发 送 一 个 消息 分 别 给 结 点 2 和 结 点 
3， 它 们 都 还 没有 收 到 过 消息 。 
快照 2 结 点 2 和 结 点 3 分 别 收 到 消息 (3,1) 利 (4,1)， 
结 点 3 已 将 (10,3) 消 息 送 入 结 点 4 且 结 点 4 已 收 到 消 

图 65 AMAL GOLE) B. 
快照 3 结 点 5 和 结 点 6 分 别 从 结 点 4 收 到 消息 (11,4) 和 (12,4}。 结 点 56 送 回 一 个 应 答 消 息 
给 结 点 4， 且 结 点 4 收 到 了 这 个 应 答 消息 。 接 着 结 点 4 又 收 到 了 (3.2， 它 送 一 个 应 答 消息 
给 结 点 3。 同 时 向 结 点 5 和 结 点 6 发 送 消息 (6,4) 秋 (7,4)， 当 结 点 5 种 结 点 6 收 到 消息 后 ， 
点 5 送 回应 答 消 息 给 结 点 4 且 结 点 4 已 收 到 这 个 应 答 消 息 。 
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快照 4 结 点 3 送 一 个 应 答 消息 给 结 点 1。 由 于 结 点 3 的 num,—0, 结 点 5 送 回 (2.5) 到 结 
点 2， 这 样 引起 结 点 4 送 一 个 应 答 消息 到 结 点 1。 此 时 结 点 1 收 到 所 有 的 应 答 消 息 ， 它 终 
止 算法 6.9 的 第 一 阶段 的 执行 。 
X61 算法 6.9 第 一 阶段 执行 图 6.5 TR 
[ M BAI 1|12]|]3]|24 
d, 0 p so | æ 
1 father) 11213|4]|51]|]$6 
num, 2 0 E! 0 0 1 D 
d ola |4| o s| | 
2 father(). 1 ililla s 6 | 
num, 2l% i o oT 0 
[ao a a sla] 
3 father() ad 1 
num, 2/1 [0 {2/0 ,0 
d, 0|12|44,5316157 
4 | fe) | 1|5]|1 2.4.4 
mm | 0 | 2 | 0 iio 


6.5.33 ”算法 的 正确 性 证 明 

首先 我 们 定义 有 穷 结 点 和 无 穷 结 点 的 概念 。 一 个 结 点 i 车工 ,= — oo. Wi RER 
结 点 ; 否则 ，i 是 有 穷 结 点 。 接 着 我 们 证 明 算法 6.9 是 正确 的 。 
引 理 6.3 ”从 源 点 s 到 某 一 结 点 /之 间 存 在 一 条 有 穷 路 径 4; ， 若 第 一 阶段 没有 终止 ， 则 
在 某 一 时 刻 必 有 di «d; . 
证 明 ”我 们 对 路 径 上 边 的 数目 进行 归纳 证 明 ， 当 路 径 上 边 的 数目 为 0 时 ， 引 理 6.3 显然 
成 立 ， 现 假定 引 理 6.3 对 所 有 边 的 数 旭 小 于 等 于 的 路 径 都 成 立 ， 考 虑 一 个 从 > 到 /有 上 
二 1 条 边 的 路 径 ， 其 中 i 是 j 的 父 结 点 。s 到 i 的 路 径 长 度 为 4，”=d， 一 wi, D). 根据 妇 
纳 假设 ， 在 计算 过 程 中 ， 最 终 有 d «d; =d; —w(, J) DIe, A 了 最 终 收 到 消息 
(d, + w(, j) D CHRE d «d, cw, «dr. 根据 算法 规定 ，d, 是 下 降 的 .因此 在 
计算 过 程 中 d «d. 
引 理 6.4 ”如 果 第 一 阶段 没有 终止 ， 那么 在 计算 的 菜 一 时 刻 ， 每 个 光 穷 结 点 /最终 有 一 个 
TARIE A Tather(/), SETS SEHR, /最终 有 一 个 有 穷 父 结 点 father). joel. 


证 明 ”下 式 对 所 有 A je 1 在 任何 时 候 总 是 成 立 的 ， 

车 i 一 father(j)， 则 d， + w(i,j) < 4d)， 根 据 最 短路 径 定义 L, <d, # i= fathers), 
REL, wGJ)«d,. 3 /是 一 个 无 穷 结 点 ， 则 由 引 理 6.3 可 知 ， 最 终 d 将 变 得 任意 小 。 
元 其 是 ， 在 计算 的 某 个 时 刻 ， 对 每 个 有 穷 结 点 有 d, Low). 因此，father(7) 将 
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是 一 个 无 穷 结 点 ， 由 引 理 63 知 ， 如 果 第 一 阶段 没有 终止 ， 那 么 每 一 个 有 穷 结 点 字 最终 
AL =d, MA fatherli) 将 是 这 条 路 径 上 的 最 后 一 个 中 间 结 点 。 所 以 father(i) 也 必须 是 
一 个 有 穷 结 点 . 
定理 6.5 算法 6.9 的 第 一 阶段 最 终 会 结束 . 
证 明 ”假定 第 一 阶段 永远 不 终止 ， 那么 在 算法 6.9 的 第 一 阶段 计算 的 某 个 时 刻 ， 每 一 个 
有 穷 结 点 Ed = 工 /， 因 此 每 个 有 穷 结 点 从 d =L, 时 起 不 再 发 送信 息 . HSE 64 有 
穷 结 点 最 终 形 成 一 棵 根 为 s 的 有 向 树 ， 这 里 father(j) 是 j HEAR. ERRA HR, 
时 结 点 Qt s) 既 不 可 能 是 任何 有 穷 结 点 的 父 结 点 ， 也 不 可 能 是 任何 无 穷 结 点 的 父 结 点 ， 
所 以 ， 由 引 理 6.4， 最 终 有 num 一 0， 结 点 7 送 一 个 应 答 消息 给 father(j)。 对 树 的 高 度 进 
行 归纳 证 明 可 得 : 每 个 有 穷 结 点 / 最 终 有 num = 0。 若 s 是 一 个 有 穷 结 点 ， 它 将 终止 第 
一 阶段 的 计算 ; 车 s 是 一 个 无 穷 结 点 ， 很 据 引 理 6.3， 它 最 终 会 检测 到 自己 在 一 个 负 环 
中 ， 因 而 终止 第 一 阶段 的 执行 。 因 此 第 一 阶段 总 会 结束 的 。 这 与 前 提 假 定 矛 盾 ， 定 理 得 
证 . 
定理 6.6 ”在 算法 6.9 的 第 一 阶段 终止 时 ， 若 7 是 一 个 有 穷 结 点 ， 则 d ;= 工 | H num, 
= 0; 若 了 是 一 个 无 穷 结 点 ， 则 当 且 仅 当 这 个 时 刻 ， 存 在 菜 个 结 点 i， 在 图 G 中 有 一 条 
As 到 的 路 径 ， 而 且 这 条 路 径 通 过 i Hnum, >0, 
证 明 ”对 于 一 个 有 穷 结 点 /7， 我 们 定义 eG) 为 从 s FB 的 最 短路 径 的 边 数 。 若 存在 几 条 
最 短路 径 ， 则 选择 其 中 一 条 无 环 且 边 数 最 多 的 路 径 之 后 ， 用 归纳 法 对 所 有 结 点 7 (其 
中 e( 门 和 大 大 = 0，1，…) 进行 归纳 证 明 即 可 。 

对 于 无 穷 结 点 来 讲 ， 我 们 采用 反 证 法 证 明之 ， 假 定 每 个 无 穷 结 点 7， 在 * XD 路 径 
上 的 所 有 中 间 结 点 b num, = 0。 在 算法 6.9 的 第 一 阶段 结束 时 ， 即 使 * 没有 终止 第 一 
阶段 的 计算 ，. 了 也 绝对 没有 收 到 有 关 的 路 径 长 度 的 消息 ， 因 而 d 将 不 会 变 小 ， 这 就 与 引 
理 6.3 MOTB. 
定理 6.7. 算法 6.9 的 第 二 阶段 将 结束 ， 且 在 那 时 每 个 结 点 Ad, =L, 
证 明 ”第 二 阶段 将 终止 。 因 为 每 个 结 点 至 多 收 到 两 个 消息 ， 即 收 到 “6ver 2” 消息 之 后 接 
着 收 到 “over — " 消息 。 没 有 有 穷 结 点 收 到 “over — “消息 ， 因 为 在 从 * 到 一 个 有 穷 结 点 
的 路 径 上 没有 无 穷 结 点 。 所 以 在 第 二 阶段 ， 有 穷 结 点 j 的 d 保持 不 变 . 根据 定理 6.6, 
在 第 二 阶段 开始 时 4 ,= 工 ,。 对 一 个 无 穷 结 点 来 讲 ， 在 第 一 阶段 结束 时 ， 从 s 到 无 穷 结 
点 /之 间 存 在 一 条 经 过 结 点 i 的 最 短路 径 ， 而 且 num, > 0. 其 结果 是 : 一 旦 结 点 站 收 到 
任何 第 二 阶段 的 消息 ， 它 将 传送 一 个 “over -“ 消息， 最 终 d = -o= Lp 


6.6 小 结 


本 章 主要 介绍 图 论 上 另 一 个 极其 重要 的 问题 一 一 最 短路 径 问 题 的 一 些 并 行 算法 ， 
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具体 地 讲 ， 基 于 SIMD 共享 存 贮 模 型 ， 介 绍 了 单 源 最 短路 径 、 以 及 所 有 顶点 对 之 间 的 最 短路 
径 的 并 行 算法 ; 基于 Systolic 二 维 网 孔 阵 列 ， 讨 论 了 所 有 顶点 对 之 间 的 最 短路 径 并 行 算法 ， 基 
于 MIMD 共享 存 贮 模型 ， 给 出 了 Moore 算法 的 并 行 化 实现 算法 ; Sus. SET OPUS OZ) 
布 式 计算 模型 ， 介 绍 了 一 个 求 音源 最 短路 径 的 分 布 式 算法 ， 

有 关 求 图 的 最 短路 径 问题 的 并 行 算法 ， 已 经 取得 了 一 些 成 果 ， 参 见 表 6.2 和 6.3. 但 


Ael 单 源 最短 路 径 问 题 的 并 行 算法 


时 间 | 作者 & 型 时 间 复杂 性 m 注 
PE 
1982 Chenl™ MIMD O(dn') 
| 
| | 
1985 | Paige 和 Kmaskalm | SIMD-EREW PRAM O(nm/ ptnlogp) Op | 


1987 Lakhani? — | MIMD 0G) 


H 

| 

| i 
SIMD-CRCW PRAM O(nm / prnloglogp) | Oin) i 

! i 

i 

| 

1 


om | 

1989 [Lakshmanan 等 人 中 分 布 式 | O(n) O(mn) 

说 明 : = 为 图 的 顶点 数 ;m 为 边 数 ; p RAR dN. 

表 6.3 所 有 顶点 对 之 间 的 最 短路 径 并 行 算法 
| m | I 

时 间 | Ex ay wuare |g 
_ m i i ARTE | 

1981 | — Deka SAM! 洗 牌 及 直立 方 O(log’n) i On) ! 


; 

| i 

1982 | Reif Spirakis" |SIMD-CREW PRAM | O(lognloglogs) | O(n’) | 期 望 时 间 
i 


f | SIMD-CRCW PRAM Oüoglos | Ow) | pani 
| | ; 
| 
1984 | Frieze #1 Rudolph"! | SIMD-CRCW PRAM | O(logn) On") | 
| | 
| 
| 
| 


1986 | Sinha 4$ A^ Systolic 网 孔 O(nogm į Ola") 


L 


Rd: n ER DK 


基本 上 都 是 基于 Dijkstra 算法 及 Floyd 算法 ， 后 者 又 称 为 传递 闭 包 方法 ， 其 实 后 者 的 并 
行 化 实质 上 是 矩阵 乘法 的 并 行 化 .基于 SIMD-EREW PRAM 和 SIMD 
-CRCW PRAM 两 种 计算 模型 ，Paige AEM p 个 处 理 器 ， 给 出 了 时 间 复杂 性 分 
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别 为 O(nm / p+ nlogp) 和 Olam /p+ nloglogp) 的 单 源 最 短路 径 算法 。Reif 等 人 "" 注意 
到 一 个 合 # 个 顶点 的 随机 图 (Random Graph) 平均 直径 为 O(logn)， 求 所 有 顶点 对 的 矩阵 
乘法 ， 平 均 只 需 执行 O(loglogn) K, KH, 在 SIMD - CREW PRAM fii SIMD 
一 CRCW PRAM 上 ， 求 所 有 顶点 对 之 间 的 最 短路 径 ， 分 别 需 0 (lognloglogn) 期 望 时 
FJ. O(n”) 处 理 器 和 O(loglogn) SHAM TE], O(n?) 处 理 器 ，Frieze 4 A 基于 SIMD 
一 CRCW PRAM 计算 模型 ， 给 出 了 一 个 随机 求 最 小 值 的 并 行 算法 ， 这 个 算法 在 使 
用 0(m) 处 理 器 时 ， 几 乎 可 在 O(1) 时 间 完 成 ， 运 用 这 一 结果 ， 他 们 给 出 了 一 个 几乎 仅 
需 O(logn) 时 间 就 可 求 所 有 顶点 对 之 问 的 最 短路 径 的 并 行 算法 。 算 法 的 期 望 时 间 复 杂 人 性 
为 O(loglogn)， 处 理 器 复杂 性 为 O(n ). 基于 二 维 细胞 自动 机 ，Levitt 等 人 中 曾 给 出 一 
个 OG) Bil]. O(n^) 处 理 器 (细胞) 的 所 有 顶点 对 之 间 的 最 短路 径 算法 。Dekel AA” 
基于 洗 牌 及 超 立 方 这 两 种 互连网 络 模型 ， 给 出 了 时 间 复 杂 性 为 O(log”n)， 处 理 器 复杂 性 
28 O (n^) 的 所 有 顶点 对 之 间 的 最 短路 径 算法 。Sinha FA" 在 二 维 Systolic MILE, KH 
了 一 个 所 有 顶点 对 之 间 的 最 短路 径 并 行 算 法 ， 这 一 算法 的 时 间 复杂 性 为 O(nlogn)、 处 理 
器 复杂 性 为 O(n”)。 此 外 ， 还 有 许多 其 它 的 最 短路 径 并 行 算法 ， 在 这 里 不 再 叙述 它们 了 . 
有 兴趣 的 读者 可 查阅 本 章 末 的 参考 文献 ， 进 一 步 了 解 那 些 并 行 算法 ， 

关于 最 短路 径 问题 的 分 布 式 算法 ， 已 有 众多 学 者 进行 研究 .这 是 因为 它 在 通信 网 络 
的 选 路 策略 中 占有 举足轻重 的 地 位 。 对 于 单 源 最 短路 径 问题 的 分 布 式 算法 ， 由 于 存在 负 
环 ，Chandy FA” 的 算法 的 复杂 人 性， 不 是 令 人 满意 的 ， 有 时 甚至 旦 指数 增长 。 为 
Jb, Awerbuch" 使 用 同步 器 对 Chandy 算法 进行 了 改进 。Laksbmanan 等 人 "” 利用 同步 
器 的 结果 ， 得 到 了 一 个 通信 复杂 性 为 0(mn)、 时 间 复杂 性 为 O(n) 的 改进 算法 . 

在 MIMD 机 器 模型 上 ，Chen™ 曾 给 出 一 个 O(dn^) BEI. O(n) 处 理 机 的 单 源 最 短 
路 径 问 题 的 分 布 式 算法 ， 其 后 ，Lakhaie 改进 了 Chen 的 算法 ， 使 得 在 处 理 器 数 不 变 的 
前 担 下 ， 时 间 复 杂 人 性 降 到 O(n"), 最近，Jenq 等 人 中 在 MIMD 超 立 方 互连网 络 上 ， 实 
现 了 所 有 顶点 对 之 间 的 最 短路 径 算法 。 有 兴趣 的 读者 可 参阅 有 关 文 献 。 
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Ste ”矩阵 乘法 及 其 
在 图 论 算法 中 的 应 用 


同 排序 和 搜索 一 样 ， 和 矩阵 乘 法 在 数值 计算 和 非 数值 计算 中 扮演 着 十 分 重要 的 角色 。 本 
章 着 重 介绍 互连网 络 上 的 矩阵 妥 法 ， 然 后 介绍 其 在 图 论 算法 中 的 一 些 应 用 、 


71 低 阵 乘法 的 一 个 简单 并 行 算法 


假定 计算 模型 是 SIMD — CREW PRAM, JERE A = (a,) 
4 BREUER C =A x B=(c,) 


ij nxn 


TL 


(0&ij«n) HIEURHGEX. BEC 定义 为 : 


axa 


£47 Es. *b,, 
由 此 ， 我 们 可 直接 给 出 一 个 并 行 化 算法 。 算 法 的 形式 化 描述 如 下 : 
算法 7.1 PARALLEL MATRIX MULTIPLICATION 


RA: AEBMRATOB, A. Bn x nE 
输出 : RC = 4 x B, Chn xne. 


begin 
(1) for each i, j k: O<i, j, k «n pardo 
(2) templi, } k)e ali, k)«b(k, j); / * 计算 两 个 对 应 项 的 积 * / 


(3) ei, j) - È templi, j k) 
m 
endfor 
end. 


定理 7.1 在 SIMD — CREW PRAM L, HARA n 阶 和 矩阵 的 乘积 ， 算 法 7.1 
需 O(logn) HEL, O(n") 处 理 器 ， 

证 明 ”由 算法 7.1 可 知 ， 算 法 的 第 (2) 步 需 0(1) BERI. O(n?) 处 理 器 ; 第 (3) UE 
$8 O(logn) HE). O(n^) 处 理 器 .因此 整个 算法 需 O(logn) ITA]. O(n”) AERIS. 

推论 7.1 在 SIMD — CREW PRAM 上 ， 计 算 两 个 4 阶 和 矩阵 的 乘积 ， 可 以 使 
H O(n’ / loga) 处 理 器 在 O(logn) 时 间 内 完成 ”， 

证 明 ”在 算法 7.1 中 ， 对 每 个 处 理 器 不 是 每 次 分 配 一 个 元 素 ， 而 是 分 配 至 多 
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为 flogn! 个 元 素 ， 则 算法 的 第 (2) 步 需 O(logn) AIL, O(n? / logn) 处 理 器 ; 第 (3) 步 
需 O(logn) H, O(n’ / logn) 处 理 器 .因此 整个 算法 只 需 Oflogn) HH], O(n* / logn) 
处 理 器 . 


7.2 SRE RRR ER 


Gentleman" 曾经 证 明 : 在 二 维 网 孔 上 两 个 上 阶 矩阵 相 科 需要 O(n) 数据 选 路 
# (Data Routing Steps)。 在 介绍 这 个 下 界 之 前 ， 我 们 先 引 入 多 个 引 理 . 假定 在 某 种 计算 
模型 上 ， 已 知 一 个 数据 在 其 中 一 个 处 理 器 中 . 令 o(k) 表示 经 过 或 更 少 的 数据 选 路 步 
后 ， 数 据 被 广播 到 的 处 理 器 数目 的 最 大 值 。 例如， 在 二 维 网 孔 上 ，c(0) = 1，c(1) 
=5, o(2)=13, RHE, o(k)= 2k! +k +1, 
引 理 7.1 ”在 二 维 网 孔 上 ， 两 个 = 阶 和 矩阵 478 BEAR, BRA 与 B 的 每 个 元 素 都 仅 
存放 在 一 个 处 理 器 中 ， 且 没有 处 理 器 含有 矩阵 4 BWA TOR. 阿 时 还 不 考虑 数据 广 
播 设施 。 则 4 与 D OIRBUERE C 至 少 需 s 个 数据 选 路 步 ， 这 里 c(2s) > n^. 
证 明 EGEGEBUERME C 的 任 一 元 素 cy CREME 4 的 第 i 行 元 素 同 矩阵 B 的 第 j 列 元 素 
的 内 积 ， 从 存 贮 这 些 元 素 的 处 理 器 到 存 贮 元 素 cv 的 处 理 器 之 间 必 然 存在 一 条 路 径 . Ss 
是 最 长 的 这 样 一 条 路 径 . 如 图 7.1a) Bia. 换 句 话说 ， 创 建 乘积 矩阵 至 少 需 * 个 数据 选中 
z. 
事实 上 ， 注 意 到 这 些 路 径 也 可 用 于 定义 任 一 元 素 b ,到 每 个 元 素 ev 长 度 至 多 为 2s 的 
路 径 (l<ij<a) BEB), 存在 一 条 到 存 贮 c, 处 理 器 的 路 径 ， 且 这 条 路 径 长 度 至 
多 为 s( 如 图 7.1(b))。 因 此 存在 一 条 从 任 一 元 家 5 ,, BENER a, 的 路 径 ， 此 路 径 长 至 多 
为 28， 类 似 地 ， 从 任意 一 个 元 索 ae 到 每 个 b, 之 间 存 在 一 条 长 度 至 多 为 2s 的 路 径 (1 
«iüjsn). 
AJ n^ 个 元 素 分 别 存 于 唯一 的 处 理 器 中 ， 由 于 从 存 贮 元 索 5 ,的 处 理 器 到 存 贮 4 元 
罕 的 处 理 器 路 径 的 长 度 至 多 为 22， 根据 a IEX. eQs)2n. 


(2) 到 cu 的 路 径 小 于 等 于 O ATE au 到 b,, 不 超过 2s 个 数据 选 路 步 
图 7.1 引 理 7.1 的 证 明示 例 
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定理 7.2 ”在 二 维 网 孔 上 ， 两 个 n IE O(n) 个 数据 选 路 步 ， 或 对 很 大 的 # 来 
讲 ， 大 约 要 s > 0.35n 个 数据 选 路 步 。 
证 明 ”由 引 理 7.1 可 知 ，o(2s) > n^. 又 在 二 维 网 孔 上 ols)==2s + 2544. Bl o(2s) 
—205) + 2(2s) + 1， 因 此 可 得 : 

8 +4s+1 >n? 
Als’ 4+5/241/83n°/8 

(s+1/4) 41/1627 /8 


故 sen? /2-1/4/2-1/4 


73 SED SLE NAE EROR GR 


假定 在 n^ 个 处 理 器 的 网 孔 上 ， 网 孔 边 界 有 对 应 的 线路 (ER) 相连 ， 那 么 在 这 种 
计算 模型 上 设计 一 个 O(n) 时 间 的 n MERRER EE ERRANS. 

TEM: A. BERERE C 的 元 素 都 存放 在 对 应 编号 的 处 理 器 中 ， 即 编号 为 {i,j) 的 处 

理 器 的 AGS). BOJ) 及 CON BRA A. BRC 对 应 的 元 素 (0 < Lin). 算法 初始 化 

Bí. AQ.i)ca,, B(G.J)cb,. 算法 由 两 步 完成 : 第 一 步 是 4 与 B 的 值 对 准 ， 结 


AG * BUA) IE CU) 的 一 项 ORB: CA) 二 Ta, * b,j， 由 项 组 成 ) .所 谓 


HEEM RILI i ITERE 4 的 所 有 元 素 向 左 循环 移动 位 置 i 次， 同时 第 j 列 上 和 矩阵 B. 
的 所 有 元 素 向 上 循环 移动 位 置 / 次 .完成 上 述 动作 后 ， 编 号 为 0,7) 的 处 理 器 (L7) 的 元 
KH a, aroman’ BD RIERA buius p WAGS)* BOJ) Æ CGU) 的 一 个 有 效 
项 . 第 二 步 是 网 孔 上 4 的 每 行 元 素 向 左 移动 一 个 位 置 ，B 的 每 列 元 素 向 上 移动 一 个 位 置 ， 
这 时 编号 为 (i,j) 的 处 理 器 中 相应 元 素 的 乘积 AG, 7) * B(i,j) 是 CEJ) 的 一 个 新 项 . ME x 
这 样 的 移动 ， 则 得 到 了 Ci) 所 有 各 项 。 应 该 注意 的 是 : 每 当 形成 CL) 新 的 一 项 时 ， 就 
把 这 项 加 入 到 C(,7) 的 部 分 和 和 上， 结果 CUJ) 是 4 的 第 i 行 和 B 的 第 j 列 的 内 积 . 
二 维 网 孔 上 矩阵 以 法 算法 的 形式 化 措 述 如 下 : 


算法 7.2 MATRIX MULTIPLICATION ON MESH ARRAY 
输入 : 每 个 编号 为 ij) HABA ETE ARSE BN TT Ka, Ab yO SIJAN 
输出 : 每 个 编号 为 GJ) ORBSAERRER CHAK (0 < Lien). 
begin 
(1) for /—0 to n — 1 do / a A 和 B 的 值 对 准 * / 
(2) for cach i,j: O<i, j«n pardo 
(3) if i>i then A(i, j) ^ AG, G+ 1) mod n) endif; 


一 108 一 


{4) if ji then Bi, j) - B((i - 1) mod n, j) endif; 
endfor 

endfor ; 
(5) for each i, j:0 «x i,j«n pardo / * CRAs / 
(6) Ci, )) Ali, D * BEA) 

endfor ; 
{7) for I-i to 5 —1 do /* 计算 C 的 其 它 项 * / 
(8) for each i,j: O<i, j«n pardo 
9 Ali, J) -A(, (7+ 1) mod n); 
(10) BG, j) - B((i+ 1) mod 2,7); 
an CH, D CU, D) * AG, D* BG, j) 

endfor 
endfor 

end. 


算法 中 ”后 “符号 表示 将 一 个 处 理 器 中 的 数据 传递 到 另 一 个 处 理 器 中 去 的 操作 ， 
定理 7.3 ”在 边界 有 硬 线 连接 的 二 维 网 孔 上 ， 计 算 两 个 阶 矩 阵 乘积 的 算法 7.2 需 OQ 时 
闻 、O(n”) 处 理 器 . 

证 明 算法 7.2 的 第 (D 到 (4) 步 需 O(n) BE], O(n?) 处 理 器 ; 第 (3) 到 (6) 步 需 OC) 时 
B]. O(n^) 处 理 器 ; 第 (7) 到 (11) 步 需 O(n) REI. O(n?) 处 理 器 因此， 整个 算法 
f O(n) MT, O(n”) 处 理 器 。 

在 上 述 算法 中 ， 假 定 二 维 网 孔 计 算 模型 边界 有 硬 线 连接 。 即 编号 为 (i,0) 的 处 理 器 同 纺 
号 为 (i,n 一 1 的 处 理 器 有 线 互 连 ,编号 为 (0,i) 的 处 理 器 同 编号 为 (n 一 1,7) 的 处 理 器 也 有 
线 互 连 (0 < i<n). 事实 上 ， 边 界 约 东 条 件 可 以 放松 。Dekel 等 人 已 证 明了 在 边界 没有 看 
线 连 接 的 情况 下 ， 二 维 网 孔 上 托 阵 乘法 仍然 只 需 OMIN. O(n?) 处 理 器 中 


74 超 立 方 上 的 竹 阵 乘法 算法 


Dekel 等 人 在 超 立方 等 互连网 络 模 殉 上 实现 了 拭 阵 乘法 。 他 们 算法 的 关键 是 给 出 了 
一 种 巧妙 的 数据 选 路 策略 (Data Routing Strategy)。 在 给 出 算法 之 前 ， 先 引入 一 些 记号 和 
术语 . 


令 一 个 整数 i>0 的 二 进 制 表示 的 第 :位 为 i ，0 <r <1logn， 约 定 n=2". i 的 二 进 


BERA aiai i 表示 一 个 二 进 制 数 : 04 04, Tlie 其 中 


i,=1-i,. 
SN AM n — 2” 个 处 理 器 组 成 的 网 络 ， 从 原理 上 讲 ， 我 们 将 这 
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个 处 理 器 想象 成 zx x n xz 的 唱 格 排列 ， 然 后 按 超 立方 互连网 络 规则 处 理 器 互 连 起 来 . 处 
理 器 采用 行 主 方式 编号 ， 也 就 是 说 ， 位 于 阵列 (i, E) 位 置 的 处 理 器 编号 是 en? 十 pon 
+k, SS SEMA ry ery, yt 9I 

i= Pag a j= tuas k =r ats (0x i, jk-«n). 

4 AG, LE), BG, lk) Be CG, 11) PERI Dr n^ + 关于 十 大 的 处 理 器 的 寄存 
器 .和 矩阵 4 及 矩阵 B 的 元 案 在 算法 开始 前 已 存放 在 下 述 编号 的 处 理 器 中 ，4(0,jk) 
=a,, BO, h k)- b,. RAR RAM C 的 元 素 存 放 在 C(0, hk) = cp P 
O<i, jk«n. 

算法 分 三 步 执行 : 第 一 步 将 矩阵 4 与 互 的 元 素 按 如 下 的 要 求 广播 到 n 个 处 理 器 中 。 
广播 后 位 于 (1, jk) 处 理 器 的 寄存 器 内 容 分 别 是 : AQ, 5) =a. BU, Lk) o bus 第 二 步 
给 乘积 矩阵 CMM, AFU, j, k) PMB REBAR AC, j, k} 
— AU, jk) B01 记 k)， 即 对 应 项 的 积 是 4,,* bj,; 最 后 一 步 计算 C 的 其 它 项 的 和 ， 即 计 


AY CU, KR). WHOS j ken. 
超 立方 上 先 阵 对 法 算法 的 形式 化 描述 如 下 


算法 73 MATRIX MULTIPLICATION ON HYPERCUBE 
输入 : MTA intj MRABAMEFARBE BH ARG, X b (0&i, j«n); 
输出 : 编号 为 ix 十 的 处 理 器 存放 矩阵 C 的 元 素 cj(0 <i, n). 


begin 
/ * (DEQ)SSHECE ET M. HERA RMALRE P, MiA» / 
(1) for i- 3q — 1 downto 2q do 


for each j: 0xj«n) pardo 
if j, —0 then 4(/)+ A() endif ; 
if j, =0 then B(/”)+B(j) endif; 
endfor 
endfor ; ^ 
(2 fori—4—1 downto 0 do / *#A(i, j DHASAN AG, § +P */ 
for cach j: 0xj«n! pardo 
if i, then 4(/^)- A() endif 
endfor 
endfor ; 
(3) for /<-2q—1 downto g do / * W.B(i, i, KYA RAB LE BG 天) 中 * / 
for cach j: O<j<n’ pardo 
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if j,=/,,, then BG?) B() endif; 
endfor 
endfor ; 
(4) for cach j: 0<j<n pardo / * RIIIE» / 
Cü)- AG) * BG) 
endfor ; 
(5) for 1—24 to 3; — 1 do 
/ 对 各 项 内 容 相 加 ， 结 时 放 入 规定 编号 的 处 理 器 中 * / 
for cach j: O<j<n’ pardo 
Temp) + CG^); 
C() € CQ) + Temp) 
endfor 


endfor 
end. 


HE AG, {= AG n^ e jens, B, C 也 类 似 (0 i uk en). E720 T4627 
个 处 理 器 组 成 的 超 立 方 上 ， 两 个 2 阶 矩 阵 4 与 BRAM RAT. 


“Ld 


图 7.2 ”SIMD- 超 立方 模型 上 的 并 行 矩阵 乘法 
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定理 7.4 ”在 超 立方 上 ， 计 算 两 个 n REM EBUE PEU AERE 7.3 需 O (logn) 时 
Bj. O(n^) 处 理 器 ， 
证 明 ”算法 7.3 的 第 (1) 步 需 0(9) MTT). O(n") 处 理 器 ; 第 (2) 558 OG) WI. O(n”) 
处 理 器 ; 第 (3) 298 0(9) TT. O(n) 处 理 器 ; 第 (4) 步 需 0(D EIS. O(n") 处 理 器 ; 
第 (5) 步 需 0(9) MIA. O(n?) 处 理 器 。 因 此 整个 算法 需 59 个 数据 选 路 步 ， 且 # 一 2 ， 所 
以 算法 需 0(logn) HEA. O(n?) 处 理 器 . 

Dekel 等 人 还 给 出 了 处 理 嚣 数 分 别 为 x*?，n”p 及 po pen) WPL LEER 
法 算法 ， 这 些 算法 的 基本 原理 同 本 节 是 一 致 的 ， 但 算法 中 数据 选 路 更 复杂 ， 故 不 在 此 介 
58. 


75 洗 牌 网 络 上 的 矩阵 乘法 算法 


上 面 我 们 介绍 了 超 立 方 上 的 矩阵 乘法 算法 。 这 几 我 们 将 介绍 Dekel 等 人 W 在 洗 牌 网 

络 上 的 矩阵 科 法 算法 ， 算 法 假定 有 n^ 个 处 理 器 。 矩阵 4 及 矩阵 B 以 及 乘积 矩阵 C 的 数 
据 在 处 理 器 的 存放 方式 同 在 超 立 方 上 的 存放 完全 一 致 .算法 的 基本 步 又 同 超 立方 上 算法 的 
步骤 也 相同 但 由 于 互 连 拓扑 结构 的 不 同 ， 因 而 算法 实现 细节 也 有 些 不 同 。 

下 面 一 些 语句 将 在 算法 中 用 到 : 

(D AG) - AQ), TRAE. Exchange 函数 选 路 ; 

Q) A(Shuffe(/)) AU), TAB Shuffle 函数 选 路 ; 

(3) A(Unshuftle(/)) AG), WE Unshuffle 函数 选 路 ; 

这 里 : 0« j<n ,数据 初始 分 布 仍然 是 位 于 (0, 1, 0) 位置 的 处 理 器 的 寄存 器 4(0, 0) 
=a,» BO, i, t)=b,, O<i, ten, 


WERA LE EMR a aK BI SX A RF: 


算法 74 MATRIX MULTIPLICATION ON SHUFFLE — EXCHANGE 
WA: 编号 为 rn HUREEESAEEARIRA ARG AEB ARD (0 <i, j«ny 
输出 : BER int jf HREBAEMECHAKC, (0« i, j«n). 
begin 
/ * (DE3)F ARREST, BRANT RABE, Reais ee y 
(1) for b—0 to q—1 do /* #4, B*/ 
for each i: Oci«cn! pardo 
A(Shufile (i) = 4(i) ; 
B(Shuffle (i)) - B(i) ; 
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if i, —0 then 4(/°)=A() endif; 
if i,=0 then B() BG) endif 
endfor 
endfor; / * WAAC, 1, p) a, B(tp)yb,*/ 
(2) for b<0 to 9 —1 do 
for each i :0gi<n’ pardo 
A(Shuffle (i) = A(i) 
endfor 
endfor; / * HOR) A(i, t, p) = a, 


p BG t p= b,,* / 


Q) for each i: Ox i«n? pardo / * RREI * / 
CU) AG)* BG) 
endfor; / * sL21C(i, tp-a +b + / 
(4) for b<-0 to gq—1 do 
for cach i: 0« i «n^ pardo / * 计算 乘积 矩阵 C 的 各 项 * / 
C(Shuffle ()) = C(i) ; 
tempi) + CU); 
CU) CQ) + temp) 
end for 
endfor; /此 时 , C(t, p, i) = C, Clt, Pt = Cit 
(5) for be-0 to g—1 do 


for each i: O<i<n’ pardo 


C(Shuffle(1)) = C(i) ; 
if (j, — 1) and (j, =1) then CG) e CG) end if 
endfor 


endfor ; /C(p.10-C,, s/f 
(6) for b--0 to g—1 do /* 将 结果 放 入 和 要求 的 处 理 器 中 * / 
for each i: 0gi<n’ pardo 
ClUnshuffle(D)} + C(i) 
endfor 
endfor FA *C0, p,t)=C,,* Á/ 


end. 


定理 7.5 ”在 洗 牌 网 络 上 ， 计 算 两 个 阶 和 矩阵 的 乘积 矩阵 的 算法 7.4 48 O(logn) 时 
lj. O(n?) 处 理 器 . 
证 明 ”通过 对 算法 7.4 的 每 步 复杂 人 性 分 析 ， 我 们 很 容易 给 出 整个 算法 的 复杂 人 性， 算法 7.4 
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的 第 (1) 步 需 44 个 数据 选 路 步 ; 第 (2) 步 需 4 个 数据 选 路 步 ; 第 (3) 步 需 OC) 个 计算 
步 ; 第 (4) 步 需 24 个 数据 选 路 步 ; 第 (6) 步 需 9 个 数据 选 路 步 ， 故 整个 算法 需 Ola) 个 
HAP. 10g 个 数据 选 路 步 ， 而 算法 每 一 步 均 需 O(n?) 处 理 器 ， 故 算法 需 0(9) = O(logn) 
Ef. O(n”) 处 理 器 。 

Dekel 等 人 还 设计 了 处 理 右 数 分 别 为 #?，n*p 及 p(1& p n) AERA ME 
乘法 算法 。 这 里 就 不 一 一 再 作 介 绍 了 ， 


76 MIMD 共享 存 贮 模型 上 的 矩阵 乘法 算法 


在 MIMD 紧 而 合共 享 存 贮 模型 上 ， 对 单机 上 的 矩阵 对 法 提供 了 各 种 并 行 化 机 会 。 为 投 
述 方便 ， 这 里 给 出 单机 上 的 全 阵 著 法 算法 ， 假 定 算 阵 4 = (a)n SEMEB=(0,),,,> RE 
PEREC = (c Dice MULE ERAGE BAK A: 
算法 7.5 MATRIX MULTIPLICATION (SISD) 
procedure Matrix. Multiple (4, B, C); /*C=AxB*/ 
begin 
(1) for i—0 to [—1 do 
("my for je-0 to n — 1 do 
(1.11) 1-0; 
(1.1.2) for ke-0 to m — 1 do 
tet+a* b, 
endfor ; 
(113) epet 
endfor 
endfor 
end. 


此 算法 有 三 个 for 循环 可 以 并 行 化 ， 这 就 引出 了 一 个 有 趣 的 问题 : 当 存在 许多 适 于 并 行 化 
的 壤 套 循环 时 ， 应 该 使 哪个 循环 并 行 化 呢 ? 下 面 的 引 理 给 出 了 在 紧 燃 合 多 处 理 器 上 设计 
并 行 算法 的 一 般 指导 原则 . 

引 理 7.2 已 知 一 个 具有 p 个 活动 处 理 器 的 紧 艳 合 多 处 理 机 系统 ， 它 们 必须 经 过 一 个 全 局 
信号 灯 进 行 同步 ， 且 一 个 时 间 复 杂 性 在 最 坏 情况 下 为 10) 的 任务 ， 在 它 完成 之 后 需要 同 
步 . 那么 最 大 可 能 的 加 速 为 :(n)/ (2100) 4174 17 21 或 者 为 ON) 

EM ”为 了 通过 全 局 信号 灯 同 步 ， 每 个 进程 必须 对 信号 灯 进 行 上 锁 、 增 值 以 及 去 锁 操 
作 。 不 失 一 般 性 ， 假 定 这 些 操 作 仅 需 0(1) 时 间 . 因此 p 个 处 理 器 同步 至 少 需 O(p) 时 
间 。 在 同步 期 间 ， 工 作 量 需 p(p 一 1) /2 时 间 ( 见 图 7.3) 。 当 p= V+ 
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+ 1/27 时 ， 能 完成 的 工作 量 至 少 是 Km)， 因 此 OV z(n)) 个 处 理 器 即 可 使 处 理 时 间 达 到 
极 小 化 。 增 加 更 多 的 处 理 器 仅 能 增加 整个 执行 时 间 ( 见 图 7.4), 

上 述 引 理 72 对 并 行 矩阵 乘法 有 何 意义 呢 ? 最 内 层 的 for 循环 时 间 复 杂 性 为 O(n)， 若 对 
这 个 循环 进行 并 行 化 ， 可 获得 的 最 大 加 速 为 O(Vz )。 中间 的 for 循环 时 间 复 杂 性 为 O(n”), 
车 使 这 个 for 循环 并 行 化 ， 算 法 可 获得 O(n) 的 加 速 。 最 后 ， 最 外 层 的 for 循环 时 间 复 杂 性 
KOM) XA for 循环 并 行 化 ， 可 使 加 速达 到 O(n")。 当 然 ， 象 算法 的 可 划分 性 以 及 
4 与 B 的 元 素 冲 突 等 其 它 因素 不 可 能 得 到 这 么 多 的 加 速 、 但 一 般 来 讲 ， 根 据 上 述 的 粒度 
尺寸 引 理 7.2， 当 需要 给 出 选择 时 ， 总 是 选择 最 外 层 循环 进行 并 行 化 。 


鉴 信 执行 时 间 
时 间 一 
~- 人- 
1 
上 /同步 步 
1 ^ B 
处 理 器 ^l @ M2) +0. 2500. 
上 
1 
M 1 x 
TRAP P -1)/ 2 做 的 有 用 工作 是 1 RE DH a) 
没有 工作 需要 处 理 机 去 做 
图 73 在 MIMD 模型 上 间 步 期 间 的 处 理 图 7.4 增加 处 理 器 可 能 增加 的 执行 时 间 


MIMD 模 型 上 的 矩阵 乘法 算法 的 形式 化 描述 如 下 : 


算法 7.6 MATRIX MULTIPLICATION ON MIMD MACHINE 
输入 : SEM APEEB; 
输出 : BR CHAxB, 


begin 
(1) for each 7: 1<i<p pardo 
(2) for ic / to n step p do 
(3) for j— i to n do 
4) tc0; 
(5 for ke-1 to n do 
(6) tetra, b, 

endfor ; 
[ti] eut 

endfor 
endfor 
endfor 


end. 
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定理 7.6 MIMD RMSHE AEM E. HABIT n ERR 7.6 
$8 O(n” / p+ p) ITT, O(p) 个 处 理 大 (1 < p n) 

证 明 ”由 算法 7.6 可 知 : 每 个 进程 计算 了 矩阵 C 的 n/p 行 。 而 计算 矩阵 的 一 行 需 O(n?) 
时 间 ， 进 程 间 同 步 仅 一 次 ， 因 此 闻 步 开销 是 O(p) 时 间 。 所 以 整个 并 行 算法 需 O(n”/ p 
+ PETE). O(p) 外 理 器 (1 < px n). 

车 忽略 了 存 贮 冲 突 ， 我 们 可 以 得 到 近似 线性 的 加 速 。 但 忽略 内 存 存 取 次 数 合理 吗 ? 
假定 每 个 处 理 器 到 共享 存 贮 单元 是 等 同 的 ， 在 紧 耦 合 多 机 上 这 一 假设 是 安全 的 ， 但 对 松 
散 耦 合 的 多 处 理 器 来 讲 ， 这 一 假设 是 危险 的 。 这 是 因为 在 这 种 计算 模型 上 ， 存 取 和 矩阵 的 
HER ERE BH CRA BES. ERC” 这 样 松散 耦合 处 理 器 上 ， 将 众多 
的 共享 存 贮 单 元 地 址 保存 在 局 部 单元 上 是 很 重要 的 。 上 述 算法 在 这 种 计算 模型 上 不 能 很 
好 地 工作 。 事 实 上 ， 一 个 典型 的 进程 不 仅 必须 存 取 4 的 n/p 行 ， 而 且 它 还 必须 存 取 B 
的 每 个 元 素 ”/ p， 而 对 提取 的 每 个 元 素 仅 作 一 次 加 法 利 乘 法 运算 ， 这 不 是 一 个 很 好 的 
比率 。 上 述 算法 在 C” 上 实现 将 产生 非常 小 的 加 速 . 

所 以 我 们 必须 寻找 一 种 划分 间 题 的 方法 .一 种 诱 人 的 方法 是 利用 块 矩 阵 乘法 。 候 
定 4 ALB n BERE, Bn = 2k, WA AM 8 可 被 想象 是 四 个 大 AERE. 


已 知 抢 阵 4 和 8 已 划分 成 块 ， 那 么 C 定 义 为 : 


c [e M PAM Md 


d € 4B, + AB, A,B, +AyBy 


REBATE EPA) ERRERA. SS Za a HEE IG EET HE A FR E AIK, 
数 也 增加 。 例 如 ， 假 定 有 p= (n/ ky” 个 进程 ， 然 后 在 4 和 BUDD p Be BEF EL 
执行 矩阵 乘法 ， 每 个 块 矩阵 乘法 需 2k” KELER, kK 加 Ak KRA, Ak 
= ma /Vp， 则 新 的 算法 较 以 前 的 算法 有 显著 的 改进 ， 图 7.5 leu DORT HE BUDE TT 
JEPESREXE LTT, 


1 0 2 3 -1.4 2 -3 8 -1 14 16 
4 一 1 5 ~5 -4 2 -2 9 7 26 147 
-2-3-42]"| 3 -10 2| | 9 «4 -2 14 
一 1 2 0 0 H 0 4 5 -9 9 2 =i 
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步 Wi 计算 CI-ALQB 


aBa 
[1 0 -1 1 1 0 2 -3 -1 1 2 -3 
L4 M [ 4l p M [ 了 | 1 8 6 -1 
[-2 1l [= ‘| E 了 [? 了 ”| 10 0300 12 
[-1 2 -5 一 4 -1 2 2-2 _ 


oW z 计算 C+4,18 


d n 

[2 3] D " [? °] [! d 8 -1 14 16 
Li sj 1 0 1 5 4 5 9 7 26 17 
一 4 d [ 可 [4 d » d “lon 14 -2 14 
Lo o 1 0 0 0 4 5 _ 


图 75 ”并行 矩阵 乘法 的 分 块 矩阵 法 


7.7 矩阵 乘法 在 图 论 算 法 中 的 应 用 


7.7.1 计算 图 的 传递 闭 包 


设 一 个 有 向 图 G(V,E)，|V| o n. HE n =2", BG 的 邻接 矩阵 为 4， 则 4 的 传递 
闭 包 4 ”= (4 +D"， I 是 n 阶 单位 矩阵 ，4 ”的 计算 可 由 下 式 完成 。 
AED - (e Dy» 
而 图 G 的 传递 闭 包 4 ”可 通过 [logn1 RITE MRI. 
定理 7.7 ”在 超 立方 和 洗 牌 网 络 上 ， 计 算 n 阶 布尔 矩阵 的 传递 闭 包 需 O (log n) 时 
Hl. O(n ) 处 理 器 。 
证 明 ”根据 定理 7.4 及 定理 7.5， 在 超 立方 和 洗 牌 网 络 上 计算 两 个 阶 矩 阵 乘积 需 O(logn) 
寺 间 和 O(n?) 处 理 器 ; 而 计算 一 个 布尔 矩阵 的 传递 闭 包 需 进行 logn 次 矩阵 乘法 ， 因 此 在 
这 两 种 计算 模型 上 计算 阶 布尔 矩阵 传递 闭 包 需 (log n) BERI. O(n?) 处 理 器 


732 ”计算 所 有 顶点 对 的 最 短路 径 

SAUL GVA) (Vio n». SPATTER ERE P, E P(i, j) 表 
示 顶 点 站 到 顶点 7 的 最 短路 径 长 度 ， 令 POU, 门 表示 从 到 /至 多 经 过 天 个 中 间 顶 点 的 一 
条 最 短路 径 ， BR, Pi, 门 = PU, D. 着 «tjs e£, WP, wi D. BPW 
是 G AVAL RRS 车 <i,j > #E， 则 PU 站 = o. PP) = 0。 不 难看 出 ， 


(D flogn1 个 2 
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w L2] 


PG, j) = min (P em 


GD-P' Qm 


其 中 , k=0, 2, 4, 8, 16, -= n, O<i jen, 因此 矩阵 PO 可 由 矩阵 P? 开始 执行 矩 
阵 乘法 运算 获得 ， 即 计算 序列 PO, PO, PO, 2 POP, PO, PO 的 计算 将 矩阵 的 
REAR” FOR" v", JEPEIIDIESUS " +” EU "min" BT, P" 需 经 logn 次 矩阵 
乘法 运算 才能 获得 .为 此 得 : 

定理 7.8 ”在 超 立方 和 洗 牌 网 络 上 ， 计 算 一 个 有 向 加 权 图 G(V,E)，|V|= n 的 所 有 顶点 对 
的 最 短路 径 需 O(log’n) BHR]. O(n^) 处 理 器 . 

证 明 ” 同 定理 7.7 一 致 ， 故 不 再 装 述 ， 

推论 7.2 ”在 超过 立方 和 洗 牌 网 络 上 ， 计 算 一 个 有 向 加 权 图 GOE), V= n 的 所 有 顶点 
对 的 最 短路 径 只 需 O(logd - loga) YT]. O(n”) 处 理 器 ， 这 里 d 是 图 的 直径 ， 

证 明 ”在 超 立 方 或 洗 牌 网 络 上 执行 矩阵 乘法 需 O(logn) III. O(n”) 处 理 器 。 又 图 的 直径 
Xd, PURI P- PP 四。 所 以 经 过 rlogd1 次 矩阵 乘法 运算 ， 就 可 算出 P， 故 整个 
算法 需 O(logd - logn) RRL. O(n?) AERIS. 


773 计算 图 的 中 值 和 中 值 长 度 
令 GUY,B)， 是 一 个 有 向 加 权 图 ，IYI = n. A d(i,j) 表示 从 顶点 i 到 顶点 j 的 最 短路 
径 长 度 ， 令 h(i) 表示 顶点 i 的 权 值 (0 < hj«n). 顶点 veV 是 图 的 加 权 中 值 当 且 仅 


EAUS X AUG, D. 0k en. MERN Je V EG KU) - 1H. Me vk 


SEHE. FAAO 称 为 加 权 中 值 长 度 。 
dnd 
由 上 述 中 值 及 加 权 中 值 长 度 定义 可 知 ， 此 问题 算法 的 关键 是 求 图 的 所 以 顶点 对 的 最 短 
路 径 ， 前 面 我 们 已 给 出 了 最 短路 径 算法 : 对 所 有 keV. REFA), j) 


= DAA, XE n? 处 理 器 的 超 立 方 和 洗 牌 网 络 上 只 需 O(log) 时 间 就 可 完成 ， 然 后 
求 这 些 和 的 最 小 值 也 可 在 相同 时 间 内 完成 ， 
定理 7.9 ”在 超 立 方 和 洗 牌 网 络 上 ， 计 算 一 个 有 向 加 权 图 G(V,E)，|Y1 二 的 中 值 及 中 值 
长 度 需 Oog n) BE], O(n”) 处 理 器 . 
证 明 。 见 本 小 节 的 叙述 ， 

Dekel 等 人 还 给 出 矩阵 乘法 在 其 它 图 论 算法 中 的 应 用 ， 如 求 图 的 半径 ， 直 径 和 中 心 ， 
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求 图 的 最 短路 径 生成 桂 、 宽 度 优先 生成 树 ， 求 AOE 网 的 拓扑 排序 以 及 求 关 键 路 径 等 。 所 
有 这 些 问题 算法 ， 在 超 立 方 和 洗 牌 网 络 上 实现 只 需 O(log n) If], O(n") 处 理 器 . 


7.8 小 结 


本 章 介 绍 了 许多 图 论 算法 都 用 到 的 一 个 重要 子 过 程 一 一 矩阵 乘法 算法 。 主要 内 容 
有 : 首先 基于 SIMD — CREW PRAM， 和 叙述 了 一 个 简单 的 矩阵 乘法 并 行 算法 ; 其 次 基于 
二 维 网 孔 ， 超 立方 以 及 洗 牌 网 络 , 分 别 介绍 了 在 这 些 网 络 模型 上 的 矩阵 乘法 算法 ; 另外 还 
给 出 了 基于 MIMD 共享 存 贮 模型 上 的 矩阵 乘法 算法 ; 最 后 给 出 了 矩阵 乘法 在 一 些 图 论 算 
法 中 (如 计算 传递 闭 包 ， 求 最 短路 径 以 及 计算 中 值 及 中 值 长 度 ) 的 典型 应 用 。 

本 章 介绍 的 所 有 甜 阵 冬 法 算法 ， 都 是 最 简单 的 单机 上 算法 的 并 行 化 ，Chandra” 曾 对 
著名 的 Strassen 矩阵 乘法 算法 进行 了 并 行 化 ， 在 SIMD - CREW PRAM 上 ， 他 获得 了 
一 个 ee NA OPERAR, p< /logn, Ramakrishnan 等 人 在 一 维 线 
性 阵列 上 给 出 了 On’ / p) BERI. O(p) RAI. Hwang 等 人 设计 了 VLSI SEE 
法 算法 ， 用 以 说 明 当 处 理 器 数目 小 于 矩阵 元 索 个 数 时 怎样 执行 抵 阵 乘法 "，Savage dE 
于 STMD -CREW PRAM 曾 给 出 一 个 O(logn) Hi. O(n >y logn) 4b 38 2855 
2” Agerwala 等 人 曾 获 得 一 个 有 效 的 布尔 敌阵 乘法 算法 ， 他 们 的 算法 是 四 个 俄国 人 算法 
的 并 行 实现 四 。Van Scoy 和 Flynn 等 人 基于 二 维 网 孔 ， 分 别 给 出 了 O(n) HT. O(n?) 处 
HEAR”, Cannon 普 基于 二 维 心动 网 孔 阵列 给 出 了 O(n) 时 间 、0O(n ) 处 理 器 算法 ， 
但 他 的 网 孔 假定 边界 是 硬 线 连 接 的 叫 ， 基 于 VLSI 计算 模型 ，Leighton 在 树 网 上 给 出 了 一 
个 O(rlogn) 时 间 、O(n”) 处 理 器 算法 上 9，Leiserson 等 人 在 心动 阵列 上 给 出 了 矩阵 乘法 算 
3&7. Ulman 则 较 系统 地 介绍 了 这 方面 的 工作 只 ， 最 近 ， 染 维 发 和 陈 国 请 在 树 网 模型 上 
建议 了 一 个 新 的 矩阵 委 法 筑 法 ， 他 们 的 算法 需 O(nlogn) BH, O(n?) 处 理 器 中。 利用 这 
一 算法 ， 可 有 效 地 模拟 二 维 网 孔 模型 上 的 一 类 算法 ， 

前 面 我 们 列举 了 和 矩阵 乘法 在 图 论 算法 中 应 用 的 例子 。 实 际 上 远 不 止 这 些 ， 如 Kim 等 
人 基于 SIMD — CREW PRAM， 利 用 矩阵 乘法 分 别 给 出 了 一 般 图 的 宽度 优先 搜索 算法 以 
及 无 环 有 向 图 的 深度 优先 搜索 算法 ， 这 些 算法 需 O(logd - logn) NIE]. O(n’ /logn) 处 理 
3877. Kim 等 人 还 利用 矩阵 乘法 ， 在 SIMD — CREW PRAM 上 ， 对 二 分 图 最 大 匹配 问 
题 给 出 了 一 个 O(nlognloglognm) ML. O(n” / logn) 处 理 器 算法 "9。 和 矩阵 乘法 在 图 论 算法 
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中 应 用 非常 广泛 ， 在 以 后 各 章节 将 再 作 详 细 介 绍 。 
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SAGE BRE. XA 
双 连 通 分 支 和 桥 的 并 行 算法 


在 图 论 及 其 应 用 中 ， 无 向 图 的 基本 回路 、 关 节点 、 双 连通 分 支 和 桥 ， 是 常常 出 现 的 问 
题 。 这 些 问题 也 都 属于 图 论 应 用 的 基本 问题。 在 并 行 环境 中 ， 如 何 快速 地 计算 图 的 这 些 基 
本 性 质 ， 不 仅 具 有 重要 的 理论 音义， 而 且 具 有 很 大 的 应 用 价值 。 这 一 章 我 们 来 介绍 求 无 出 
图 的 基本 回路 、 关 节点 、 双 连通 分 支 和 桥 的 并 行 算法 。 

在 第 五 章 的 第 5.4 节 ， 我 们 已 经 引进 了 逆 树 、 最 低 公共 祖先 等 基本 概念 和 记号 ， 这 一 
章 将 继续 沿用 它们 。 尚 不 熟悉 的 读者 ， 请 查阅 该 节 介 绍 的 有 关内 容 。 


8.1. 逆 树 的 一 些 基 本 性 质 


为 了 方 使 后面 的 分 析 ， 首 先 我 们 介绍 一 些 基本 的 引 理 。 
引 理 8.1 在 SIMD 一 CREW PRAM 上 ，,，(1) 已 知 一 个 由 道 树 组 成 的 有 向 森 
Ak T(V,E^, ARR FOR FVV, BERS, ieV. 0<k<n 
AF (Ae ee p 的 F'G k) 单元 中 ， 则 需 O(n / K + logi) HBL. O(n K) 处 
3E. (2) 已 知 所 有 F O) ieV. O<k «n. S K» 1, WIE BUS DEI BUR 
E depth). $8 O(log (n/ K1) BEI. O(nK) 处理 器 ; 否则 ， 当 0< 玉 < 1 时 ， 则 
需 O( F1/ K1 * logn) È, OK) 处 理 器 。 
证 明 ”事实 上 ， 这 个 引 理 是 引 理 5.2 的 推广 ， 现 在 假定 有 nK MRR. 那么， 第 五 章 的 
算法 5.4 的 计算 时 间 为 : 当天 >1 时 ， 第 (1) 步 需 0(1) 时 间 、O(m) 处 理 器 ; BM, 
需 O(L7 KV ETT. O(nK) 处 理 器 ;第 (2) 步 的 时 间 T(n) 为 


w-d- 
T= Y (177K) 
E 
bas - 9-1 
=logK+ Y (12/0) 
tk 
1 
<logk + y Y 2'«log(n—1)—logK 


tabak 
— O(n / K + logn) 
—HF'() ieV, O<k <a MUAMRE, depth(s) 的 计算 如 下 : 对 序 
JF Gs. F'G e Fo (i) 执行 二 分 法 搜索 POW = ”作为 关键 字 ， 找 出 ;所 
BET, mir. Br 在 序列 中 最 左 出 现 的 位 置 BER i RE, M depth) =d. 当 0 
< 下 < 1 时 ， 完 成 二 分 法 搜索 需 OCTI/ KI «logi 时 间 . 车 天 > 1， 则 采用 分 组 技术 ， 
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将 每 个 顶点 : MR, FD, ns F^U (i) 分 威 六 组 ,每 组 至 多 含有 序列 中 
的 [n/ KV 元 素 ， 每 组 分 配 一 个 处 理 器 去 执行 这 组 元 素 的 二 分 法 搜索 .执行 完成 后 ， 将 
第 s 组 搜索 的 结果 与 第 s 一 1 组 及 第 s+ 1 组 的 结果 相 比 较 (2 < s < 五 )， 其 中 必 有 一 个 处 
理 器 * 的 值 同 处 理 器 * + D 的 值 一 致 ， 而 同 处 理 器 s — 1 的 值 不 一 致 。 当 s = 1 时， 则 仅 司 
第 二 个 处 理 器 的 值 一 致 ， 而 当 s = 下 时 ， 则 仅 和 第 下 一 1 个 处 理 器 的 值 不 一 致 。 这样， 就 
确定 了 + ,在 序列 中 的 最 早出 现 位 置 (+, 一 F^ O. REA depth) fff O(log Tn/K1) 
WE, iev. . M 

5/38 8.2 在 SIMD — CREW PRAM |, M24 T(V, E^) 是 连通 无 向 图 GUO, E) 的 一 
棵 生成 树 ， 且 以 逆 树 形式 存 贮 . 那么 在 树 T 上 找 出 G 的 O 对 顶点 的 最 低 公 共 祖 
先 LCA， 需 0( TQ /nkK1. logn-c n/ K) IRI. On) 处理 器 (1< Q cn). 

证 明 SIR, HA Ft 需 O(n/ 玉 +1ogn) HM. O(nK) 处 理 器 。 找 任意 一 对 
顶点 Mjh iev, jev 的 最 低 公共 祖先 ， 可 使 用 两 个 处 理 器 分 别 对 FI 第 i 行 和 第 j 行 分 
别 执 行 二 分 法 搜索 。 直 到 两 个 处 理 器 搜索 到 这 两 行 中 第 一 个 相同 的 元 素 为 止 。 这 个 相同 
的 元 素 w 就 是 顶点 i 和 7 的 最 低 公 共 祖 先 ， 即 w =LCAG,/). BOE 2 对 顶点 的 最 低 公 
HAEE O( TQ / nK1 + logn -n/ K), O(nK) 处 理 器 。 其 实 这 个 引 理 是 引 理 5.3 的 
一 个 推广 . 


82 找 图 的 基本 回路 算法 


不 失 一 般 人 性， 我 们 假定 图 G(V, E) 是 一 个 无 向 连通 图 ， 令 T(V, E^) G 的 一 棵 生 
成 树 。 对 任意 一 条 边 e = (usy)e E — E, BL (ay)、 树 了 上 的 路 径 [u — LCAQu Y) 
和 [LCA(u,y) 一 Y] 组 成 一 条 封闭 的 回路 。 这 条 回路 称 为 G 的 一 条 基本 回 
路 (Fundamental Cycle). fj fü, 在 图 8.1 rp, 对 于 元 向 连通 图 G{V, E). IVi 
二 4( 图 8.1(a)), "E 的 — R ERRE TUO, E) WMA E-E = {(1,2), (1,3), (2,3)} 
{图 8.1(8))， 图 G 的 三 条 不 同 的 基本 回路 C,,，C, 和 C, AREA ROA 
= {C> C, CK 图 8.1(0)). 


1 


2 21 1 2 2 
- 4 
4 4 4 
€i 
a * 
3 c €; 


a) 图 GVE) (9 c Hm ERR (c) 他 的 基本 回路 C... C, AC, 
图 Rl 图 G 的 生成 树 和 基本 回路 ` 


3 
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根据 基本 回路 的 定义 ， 每 一 条 非 树 边 加 到 树 了 上 都 形成 一 条 回路 ， 这 条 回路 就 是 
G 的 一 条 基本 回路 .因为 图 G HE m-(n-1) 条 非 树 边 ， 所 以 ，G 有 m-n+1 条 基本 回 
Vi. 图 -8.1 中 的 G， 六 =6，za=4， 故 共有 三 条 基本 回路 ， 令 G 的 基本 回路 集 为 
BF Ci Cr, Cree 其 中 CE ARMOR BIS 1e is m-nH. 基本 由 路 的 一 个 重要 
TERR: 图 G 的 任何 一 条 回路 C 都 是 由 若干 基本 回路 C，，C，，…，C， 的“ 环 和 “构成 
的 ， 即 C= C, OC, O-@C,. C, 6% 1«i, em nr 1«j«k. 下 面 ， 我 们 
非 形 式 地 描述 我 图 的 区 本 回路 算法 pl 


算法 8.1 FINDING FUNDAMENTAL CYCLES OF GRAPHS 
输入 : iki ELGCV, EAE HARTE, V = {1,2, nl; 
输出 : n BPSEMELCA*, FUR GP (n). 
begin 
GQ) AAGH-RERBTV, E^), TAY AXES: 
(2) 3HXAEMLCA i. 其 中 LCA * (i, NAW i do /在 T 上 的 最 低 公共 祖先 ，; 
ev. jeV; 
(3) 5HtdX—4ieeE—E, Wi e 所 在 的 基本 回路 


end. 


# SIMD — CREW PRAM 上 ， 算 法 8.1 中 的 第 (1) 步 ， 可 以 应 用 第 五 章 求 最 优 MST 
算法 构造 树 T(V, EN 第 (2) 步 利 用 F^ BH LCA * 的 值 ; 第 (3) 步 实现 如 下 : 
首先 创建 一 个 含有 n 个 元 素 的 一 维 向 量 了 其 中 *(y) 一 n 一 1 一 depth(v}， 它 是 顶点 v 
EFt PHRES, vev. Hik, HFE- RH e= (u,v)eE — E, CHERERE C 
是 由 下 列 几 条 路 径 组 成 的 : 

D KP? 第 4 行 的 第 P*(w) 列 到 第 P* (LCAG,) 列 上 的 顶点 组 成 的 一 条 路 径 工 ;; 
D MAE*R y TNE P o) 列 到 第 P' LCA * (ov) 列 上 的 顶点 构成 的 一 条 路 径 工 ;; 
3) (u,v) 组 成 的 一 条 路 径 工 ,， 
即 是 说 ，C = UL, 
定理 8.1 在 SIMD -CREW PRAM 上 ， 计 算 一 个 无 向 连通 图 G(V,E). |V| -- n 的 所 有 
基本 回路 ， 算 法 8.198 O(log’n) It], O(n” / logn) 处 理 器 . 
证 明 ”由 定理 5.6 可 知 ， 算 法 8.1 的 第 (1) 2608 O(log”n) ATM. O(n” / log’ n) 处 理 器 ; 又 
由 引 理 8.2， 令 天 =n /logn， 则 第 (2) 步 需 OCog n) IT]. O(n? /logn) 处 理 器 ; 第 (3) 
步 的 复杂 性 由 引 理 8.1 可 知 ， 这 一 步 需 O(log n) REI. O(n” / log) 处 理 器 。 因 此 整个 算 
法 需 O(log^n) HTH. O(n” / logn) 处 理 器 。 

—123— 


8.3 找 图 的 双 连 通 分 支 算法 


设 G(K, 辐 是 一 个 无 向 连通 图 ， 顶 点 veV， 若 在 G 中 存在 两 个 和 v 不同 的 项 点 i 与 
Pj. HATS 了 的 每 一 个 条 路 径 都 经 过 顶点 v M výk% G 的 关节 点 (Articulation 


Point). 


(3) 
© o 
o bo 
© © 
Gy O 
(a) 图 GZ 可 和 它 的 关节 点 (0) AG 中 移 去 关节 点 2 的 情形 


8.2 无 向 连通 图 及 其 关节 点 
这 个 定义 隐 含 着 : PAM G 中 移 去 一 个 关节 点 ， 则 将 图 G 至 少 分 裂 成 两 个 子 图 。 例 


O Wü. EFM EMO CVE), IV - 10 中 ， 共 有 三 个 关节 点 ， 它 
A 们 是 顶点 2、3 和 $. 若 移 去 关节 点 2， 则 得 到 两 个 连通 子 图 。 如 
OD (2 BR. 


当 且 仅 当 无 向 连通 图 G 不 含有 关节 点 时 ， 它 是 双 连 通 图 
83 一 个 双 连 通 图 (Biconnected Graph)。 例 如 ， 图 8.3 所 示 的 图 GOLE) 
| 由 = 一 5， 就 是 一 个 双 连 通 图 ， 它 不 存在 关节 点 。 


8.3.1 算法 的 基本 原理 


在 介绍 求 双 连 通 分 支 的 算法 之 前 ， 我 们 先 引 入 一 个 重要 的 阔 数 HLCA(u)，ueV。 设 
G(V.E) 是 一 个 无 向 连通 图 ，T(V,E) 是 G 的 任意 一 裸 逆 树 (其 根 为 re 入， 对 于 任何 一 个 项 
点 ueV, HLCAQ@)=LCAGy), HP e=(wv)e(E-EYvflwt)}， 而 且 vv 必须 满足 
depth(LCA(u,»)) < depth(LCA wv), SOTA RE IW e'— (u,v je (E-E) {u}. 

图 8.4 给 出 HLCA —4- 3k (IUE BA Bed prf K ER 7 DAI ER 2-9 ARE E 3 FA 
点 ， 虚 线 表 示 与 项 点 ue 天 关联 的 非 树 边 。 

为 了 计算 HLCA(u)» uev, Tsin 等 人 9 利用 逆 树 了 的 项 点 先 序 ( Preorder) 标 号 ， 给 
出 了 计算 HLCA(w) 的 算法 ， 现 在 就 介绍 这 个 算法 。 

STV, ENE G 的 一 棵 道 树 ， 对 树 了 上 的 每 一 个 顶点 vy， 指定 它 的 先 序 标号 为 
pre(v)。 在 单机 上 ， 深 度 优先 搜索 是 求 先 序 标号 的 一 个 有 效 算法 ， 但 在 第 三 章 ， 我 们 
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曾 提 及 ， 因 为 深度 优先 搜索 本 质 上 是 顺序 的 ， 所 以 不 便于 并 行 化 ， 因 此 我 们 采用 如 下 
的 方法 。 

为 了 叙述 方便 ， 在 树 T 上 我 们 
定义 关系 : uS y 当 且 仅 当 z 是 ， 
的 一 个 祖先 ; w Av 当 且 仅 当 & 是 ? 
的 一 个 真正 祖先 ，wue VV，veV。 

引 理 83 ERER VE), 
对 和 任意 两 个 顶点 uev, veV, v& u 
当 且 仅 当 

pre(») < pre(u) < pre(y}+nd(r) 
这 里 nd(y) 是 ， 的 子 环 个 数 ， 
证 明 ”由 先 序 遍 定义 ， 容 易 证 明 此 引 
H. 
3884 ” 设 无 向 连通 图 GCV,E)RS— 
BUM BR TVE) $ (uy)eE-E'. 
Gw)e E-E', WA: 

(1) 车 pre(y) « pre(w) < pre(u), 

JU depth(LCA(u,v))< depth(LCA(uw)y; 

(2) Æ pre(v)> pre(w)> pre(u), 图 8.4 计算 HLCAW) 

则 depth(LCA(u,v)) < depth(LCA(u,)). 

证 明 (1) REIM 8.3, pre(LCA(u,v)) < pre(v), H pre(u) « pre(LCA(u,v)) 
+nd(LCA(u,v)), Butt pre(LCA(u,»)) < pre(w) < pre(LCA(u,v)) + nd(LCA(u,y)). Hil 
38H 8.3 YM, LCA(u,v) 4 w， 所 以 depth(LCA(u,v)) < depth(LCA(u,w)). (2) 可 类 似 地 证 
8f. 

FRSA: 计算 任意 一 个 顶点 veV 的 HLCA(w) 问题 ， 可 归结 到 计 
算 两 个 特定 顶点 的 最 低 公共 祖先 问题 ， 

4 ueV, W= fy| (uv)eE -EYuful; 

pmax(w) 一， 这 里 yeW H pref) > pre(w), V weW; 

pmin(u) = v, 33H ve W H pre(v) <pre(w), V weW. 
推论 8.1 ” 设 无 向 连通 图 G(V,E) BSE T(V.E^. uev, W 
LCA(u,pmin(u), 24LCA(u,pmin(u))4 LCA(u,pmax{u}) 
LCA(u,pmax(u)), ?234LCA(w,pmax(u)) & LCA(u,pmin(u)) 
证 明 ”由 引 理 8.4 直 接 推 得 。 
引 理 8.5” 设 一 个 无 向 连通 图 G(V,E) NEM (VE), uev, Wi 

HLCA(u) = LCA(pmin(z),pmax(u)). 

证 明 由 推论 8.1 可 知 


HLCA(u) = { 
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HLCA(u)4 pmin(u), HLCA(u) 4 pmax(u) 
因此 

HLCA(u)4 LCA(pmin(u), pmax(u)) 
根据 定义 

pre(pmin(u) 4 pre(u) 4 pre(pmax(u)) 
这 意味 着 

pre(LCA(pmin(s),pmax(u)) < pre(u) < pre(LCA(pmin(u),pmax(u)) 
+ nd(LCA(pmin(u), pmax(u))). 
根据 引 理 8.3， 

LCA(pmin(u),pmax(u)) &wu 
因而 

LCA(pmin(u),pmax(u)) &LCA(u, pmin(u)) 
H 

LCA(pmin(u),pmax(u)) < LCA (u,pmax(u)) 
由 推论 8.1， 

LCA (pmin(u), pmax(u)) 4 HLCA (u) 
388.6 RV E) 是 一 棵 逆 树 ， 它 的 顶点 已 经 标 上 先 序 标号 ， 则 计算 HLCA(Q). u 
eV 98 O(n/ K c loge) MB. O(nK) 处 理 器 . 
证 明 ”根据 引 理 4.4， 计 算 pmin(u) 及 pmax(u) fF O(n / K + logk) WE. O(nK) 处 理 
器 ; 为 了 计算 HLCAQ), WRH pmax(u), pmin(u) 的 最 低 公 共 祖先 ， 一 共 需 要 找 亚 对 
这 种 顶点 的 最 低 公 共 祖 先 。 由 引 理 8.2， 完 成 这 一 工作 需 O(n/ K+11/ KI * logn) 时 
闻 、O(nK) 处 理 器 . BOLE HLCA(), uev R O(n / K + logs) iiH, O(nK) 处 理 器 (K 
21). 
528.7. BTO, EE ) 是 一 棵 有 序 树 ， 树 中 的 儿子 顶点 按 字典 顺序 排列 ， 对 中 任意 一 
个 顶点 "， 则 它 的 先 序 标号 为 : 

pr()- Y — X nd(w)+na() 


ANCO weEBROG) 


= Y  nds(F(u),rank(u) — halt depth(v) _ 


weANC()- fr] 
其 中 : rÆ TMB, ANC(?) 是 v 的 祖先 集合 ; EBRO(w) 是 的 兄长 集合 (兄弟 关系 是 
由 小 到 大 排 ) ; nd(w) 是 w 的 子孙 个 数 ; naly) 是 ， 的 祖先 个 数 ; nds(v,j) 是 v 的 前 j 个 儿 
子 的 子孙 总 数 ; rank(v) 是 在 兄弟 中 v 所 排 位 置 的 序号 . 
证 明 ”由 先 序 定 义 直接 得 到 ， 
实际 上 ， 引 理 8.7 给 出 了 计算 树 了 的 先 序 标号 算法 ， 现 在 给 出 这 个 算法 , 


算法 8.2 PREORDER TRAVERSAL OF INVERTED TREE 
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输入 : AG, ERRAT, E^). A Sa (12, Lin FRI 
输出 : 计算 结果 HLCA(Y)， vefi, 2, n]. 

begin 

(D HLT F^ E Bfodepthéo d: 

(2) 计算 rank(v); / * 对 了 的 每 个 顶点 ye 的 儿子 定 序 * / 

(3) 3EXnds(v,J) »eV, V fen), KPa) v UT. A4; 
(4) #HHLCA(), »eV 

end. 


定理 8.2 在 SIMD — CREW PRAM 上 ， 计 算 一 棵 逆 树 T(V, E^). |V| - n 的 先 序 标 
S. 算法 8.2 需 O(n / K + logn) MIR. O(n K) 处 理 器 . 
证 明 假定 逆 树 T 用 一 个 二 维 数组 T(1:2,1:m) 存 贮 . V= (1,2, nb E 
={(T0, Ð, TO, 让 11<i<n}， 对 于 根 r， 令 T(2,7) = 0， 在 算法 8.2 中 ， 根 据 引 理 8.1， 
58 (D 488 O(n / K + logn) AI. O(n K) 处 理 器 (K 2 1); 第 (2) 步 是 对 有 了 序 
对 (TQ, 2, TU, D)11<i <n} 进行 排序 ， 它 需要 O(logn) REI. OQ) 238387. RHEE 
ER TERRA TH: 2, 1: n) 中 ， 我 们 将 T ARAB. SE ELRO LAUNE: 每 段 的 第 一 
行 元 素 都 应 该 是 同一 个 项 点 "。 这 样 ， 每 段 的 第 二 行 顶点 就 是 顶点 v 的 儿子 ， 在 顶点 i 所 
属 的 段 中 ，i 在 第 二 行 所 处 的 位 置 即 是 rank(i); 算法 的 第 (3) 步 计 算 如 下 : 首先 对 每 个 顶 
Hivev, E FI 矩阵 的 第 (n — 1) 一 depth(v) 列 ， 计 算出 ， 在 本 列 中 出 现 的 次 数 ， 即 
“得 nd(v)。 根据 引 理 4.4， 这 一 小 步 需 O(n / K+ logK) 时 间 、O(nK) 处 理 器 ; 然后 ， 用 下 
述 公式 计算 nds(,/). veV, 1« j&n(v). 


nds(v, = Y nds) 1&J]«n() 


se VRFG)- v 
BAM n 个 元 察 计算 其 部 分 和 Y, ap (1 j<n) 98 OQogn) NH. O(n) 处 理 器 ， 但 树 了 


的 每 个 顶点 ， n) 个 儿子 ， 所 以 完成 上 式 需 O(logn(v)) IE]. O(n(v)) 处 理 器 。 因此， 
对 所 有 ve 完成 上 式 的 计算 ,- 8E max{loga(y) | ve V1 = O(logn) HIE]. O(Y a(v)) = O(n) 


处 理 器 。 这 样 算法 的 第 3) 步 需 O(n / K + logn + logK) 时 间 、O(nK) 463838 (X 2 1); 
第 (4) 步 的 计算 使 用 了 引 理 8.7 中 的 公式 ， 开 始 时 假定 对 任 一 顶点 reV，nds(v,0)=0， 注 
意 到 F’ 的 第 v 行 的 第 (n — 1) — depth(v) 列 到 第 (n — 1) 列 的 元 素 都 是 集合 ANCO) 的 元 
Z. Hond(y) = depth(vy)+1， 根 据 引 理 4.4， 这 一 步 需 O(n / K + logK) 时 间 、O(nKK) 处 理 
R(K> 1)。 故 整个 算法 需 O(n / K + logn + logX) 时 间 、O(nK) 处 理 器 (K > 1)。 

定理 8.3 在 SIMD 一 CREW PRAM L, B T(V,E^) 是 一 个 无 向 连通 图 G(V,E). IV] 
=n HR, MANA HLCA(w) ueV 95 O(n/ K+ logn) HA. O(nK) 处 理 
器 (K>1) 
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证 明 ”由 定理 8.2 和 引 理 8.7 直接 推 得 ， 

有 了 前 面 的 一 些 基 本 概念 后 ， 现 在 我 们 来 介绍 Tsin 等 人 基于 SIMD 
— CREW PRAM 上 的 最 优 双 连 通 分 支 算 法 。 

对 一 个 无 向 连通 图 GU, E) 来 讲 ，G 的 一 个 双 连 通 分 支 完全 可 由 它 的 顶点 集 确 定 ， 
前 寻找 双 连 通 分 支 的 任务 就 变 成 了 找 双 连 通 分 支 顶点 集 的 任务 。 为 此 ， 我 们 在 图 G(V, E) 
的 边 之 间 定 义 一 种 关系 R. 令 T(V,E) 是 G 的 — BOR, e = 0, FG). e, 
= (u, F(u)) e, €E', e,€E'. e, 和 e, 具 有 关系 RR( 记 作 e,Re,) 当 生 仅 当 满 足下 列 条 件 
之 一 : 

(D e, 在 树 了 中 的 y 到 HLCAQ) .的 路 径 上 ， 或 者 e, ÆW T'Pu 到 HLCA(u) 

BIL: 

(2) (uveE-E’, HEMT 'Pv&usku & v BRR. 

有 了 这 个 关系 R 的 定义 ， 下 面 我 们 给 出 找 图 的 双 连 通 分 支 算法 . 


8.3.2 算法 的 非 形式 化 描述 


算法 8.3 BICONNECTIVITY ALGORITHM 
WA: 无 向 连通 图 G(V,E)，|V|= nS AREE, 
输出 : 图 G 的 所 有 双 连 通 分 支 。 注意: 仅 输 出 每 个 双 连 通 分 支 的 顶点 集 。 
begin 
(1) ARGV Ey RRTV, E^) ; 
(2) 对 G 的 任意 一 个 顶点 veV， 计 算 它 的 HLCA(y); 
(3) Mie — SRL GA(E", ET, EE B. Atle, e )e E" 35 EX Be Re, 
e, €E', e,cE'; 
(4) 找 出 G* 的 所 有 连通 分 支 {B,} 


end. 


528.8 — E G(V,E) 是 一 个 无 商 连 通 图 ， 则 : (1) 对 G 的 每 一 条 边 eeE， 存 在 唯一 的 一 
个 包含 e 的 双 连 通 分 支 ，(2) G 的 同一 条 回路 上 的 边 属于 同一 个 双 连 通 分 支 。 
证 明 ”根据 关系 R MEN. de. Re, Me, Me, 同属 一 条 基本 回路 。 事 实 上 ， 不 难 证 
H: R 是 一 个 等 价 关 系 。 因 而 若 e, Re,，e ;Re,， 则 e,Re,， 也 就 是 说 ，e, Me, 也 属于 
同一 条 回路 . 
引 理 8.9. UE G(F, 且 是 一 个 无 向 连通 图 ， 若 e Re, e Re, tse, Re, MEG 中 存在 
一 条 包含 e; Re, MH, eck, 1«ixl. 
WEAR ”由 引 理 8.8 直 接 推 得 . 
定理 8.4” 设 G(V, EE) 是 一 个 无 向 连通 图 ，T(V, E^) 是 G 的 一 棵 生成 树 ， 图 G*(E, E") 构 
造 为 : 
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E" ={(e,,e,)|¢,Re,, e, €E', e, € E'1 


1k G" ip e 与 e* 属 于 同一 个 连通 分 支 ， 当 且 仅 当 在 GrP e 与 e 属于 同一 双 连 通 分 支 ，e 
ek’, eek’, 
证 明 车 e 及 e’ 在 G” 的 同一 个 连通 分 支 内 ， 则 在 G* 中 有 一 条 从 e Ble’ 的 路 
fe. ep erep e, BleRe,, eRe, c, e Re. 由 引 理 8.9，e 及 e’ 在 G 的 同一 
回路 上 ， 又 由 引 理 8.8 8 e Re’ 属于 G 的 同一 个 双 连 通 分 支 。 KZ, Hehe RE GU 
司 一 双 连 通 分 支 ， 则 G 中 存在 一 条 包 食 e Re’ 的 简单 回路 了”C。 假定 G 的 基本 回路 集 
HQ, WAFER W—-TFRIC 1 <i <1,C,eQ}, Heec o eC, He C, 
ALC, ,, 的 公共 边 (1 <i < D. Pe, — (0, » ) JE C, 中 的 一 条 非 树 边 ， 即 (4,,v,)eE 
— E', 4 elu,) 和 e(v,) BRA, BI elu) = (u, Fu) e(v) = G,, FOD BAER 
一 条 C, 中 ， 我 们 有 : 

(D efu Rep HA e, ,R eu) Se, Rey) e,Re(u) ReRe) 或 者 

(2) e, ,R e(u,) He Reu) RA 

(3) e, ,Re(v) He Rely). 
在 上 述 任何 一 种 情形 下 ， 在 G” 中 都 存在 一 条 从 e，, Ble, 的 路 径 ， 尤其 是 在 G" 中 存在 
一 条 从 e Ble, 的 路 径 和 一 条 从 e, Be’ 的 路 径 ， 将 所 有 这 些 路 径 连 接 起 来 ， 则 得 出 结 
论 ，e Re’ 同属 G” 的 一 个 连通 分 支 。 
定理 8.5 在 SIMD — CREW PRAM 上 ， 求 一 个 无 向 连通 图 G(V,E) 的 双 连 遂 分 支 ， 算 
1 8.308 O(n / K log n) MIA. OK) bI (k > 0. 
证 明 ”由 定理 4.5 及 推 沦 5.1 可 知 ， 算 法 8.3 的 第 (1) 2598 O(n / K + log n) 时 间 、O(nK) 
处 理 器 ; 第 (2) 步 由 定理 8.3 可 知 ， 需 (n/ K  log^n) ii OK) 处 理 器 ; 第 (3) 步 实 
现 如 下 : 首先 构造 G” MERE A". WEERA e e E' Me eE He, 
= (4, Flu), e, 2 G,FQ). A" (e, , e) - 1 A"(e,, e)! 4AM e, 在 树 卫 的 w 
到 HLCA(w) 的 路 径 上 , 或 (u,v)jeE 一 FEF 且 w Svily Su WARY. 又 因 |E4=n 一 1， 
而 矩阵 请 ”此 时 又 可 以 利用 ， 所 以 构造 G" 95 O(n KNA. OK 处 理 器 ; 第 (4) 步 由 
定理 4.5 可 知 ， 完 成 这 一 步 需 O(n / K log n) 时 间 、0 (nk) ADEN. 所以， 计算 图 6 
的 双 连 通 分 支 需 O(n /+10g*n) 时 间 、O(nK) 处 理 器 ， 尤 其 是 当天 = O(n / log n) 时 ， 
算法 需 O(log DAM. O(n" /log 站 处 理 器 ， 这 是 一 个 最 优 算法 。 

事实 上 ， 算 法 8.3 中 第 (4) 步 计 算出 来 的 是 G 的 顶点 集 划 分 (8 1. 每 个 ,由 6 的 
边 组 成 。 将 这 些 边 的 顶点 放 人 一 个 集合 中 ， 则 得 到 的 集合 就 是 G 的 一 个 双 连 通 分 支 的 顶 


@ 在 回路 C 中 ， 伐 首 、 尾 顶点 重合 外 ， 其 它 项 点 在 回路 上 仅 出 现 - -次 ， 则 称 C 为 简单 回路 。 
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8.4 ”用 哆 拉 裔 历 技术 求 双 连 通 分 支 算 法 


8.4.1 算法 的 基本 原理 

Tarjan & AP* 在 分 析 了 Tsin 算法 的 基础 上 ， 给 出 了 求 图 的 双 连 通 分 支 的 另 一 个 算 
法 。 算法 的 基本 思想 亦 是 将 计算 图 的 双 连 通 分 支 问题 归结 为 计算 辅 图 的 连通 分 支 问题 。 其 
显著 特点 是 : 在 树 7 上 给 出 了 一 种 称 之 为 欧 拉 遍 历 (Euler Tour) hr, (88 LS 
数 的 计算 (比如 每 个 顶点 的 先 序 标号 、 后 序 标号 及 其 子孙 个 数 等 ) 都 可 在 Oliogn) 时 间 内 
完成 ， 且 使 用 的 处 理 器 数 仅 为 O(n)。 所 请 树 的 欧 拉 遍历 技术 是 指 : 对 一 棵 树 TOVE) 的 每 
条 边 巍 予 两 条 方向 相反 的 并 行 边 ， 从 而 得 到 一 个 有 向 欧 拉 图 ， 然 后 计算 树 的 一 些 廿 数 。 即 
将 介绍 的 Tarjan 算法 ， 和 算法 8.3 相 比 较 、 至 少 有 两 点 改进 : 一 是 构造 的 辅 图 G 含有 的 
边 数 较 少 ， 辅 图 的 计算 较 算法 8.3 容易 ;更 重要 的 是 ， 由 于 在 树 上 引信 欧 拉 遍历 技术 ， 使 
得 树 上 一 些 基 本 函数 的 计算 只 需 O(logn) HY. O(n) 处 理 器 . 


8.4.2 算法 的 非 形式 化 描述 

ER GO,E), Vien 是 一 个 无 向 连通 图 。 车 好 是 G 中 边 之 闻 的 一 种 关系 ，RR 定义 
We Re, BBUS e, =e, RAe, Me, 都 在 G 的 一 条 简单 回路 上 ，e,eE，e,eE。 显 然 
边 集合 已 上 的 关系 及 是 一 个 等 价 关系 。 由 及 导出 的 等 价 类 是 G 的 一 个 双 连 通 分 支 . 

和 前 面 一 节 类 似 ， 我 们 定义 G 的 一 个 辅 图 G/，G 的 顶点 由 G 的 边 组 或 ，G’ 的 一 个 
连通 分 支 对 应 G 的 一 个 双 连 通 分 支 。 令 SSE 是 G 的 一 个 边 集合 ， 则 由 s 导出 G 的 一 个 
子 图 是 G 的 一 个 双 连 通 分 支 ， 当 县 仅 当 G' 的 顶点 集 S 导出 的 子 图 是 G^ 的 一 个 连通 分 
X. 4 T(V,E^) 是 G(V,E) 的 一 棵 生成 树 ， 我 们 用 vw 表示 一 条 树 边 ， 即 v 是 w 的 父 
3k Fw). WU G^ 的 边 是 由 下 列 的 边 组 成 的 : 

1) (uw) Ow), XB uw BT AW. (,w)eE— E’, E. pre(v) < prew) 

2) (uv uw), Xu v xo wJ& T XI. (v,w)e E -E BT HvAw 和 

<r 均 不 成 立 ; . 
3) (0,9) (vw)。 这 里 wv 和 vw 是 了 的 边 ，G 中 存在 某 条 边 将 w 的 一 个 子孙 与 
一 个 不 是 v 的 子孙 的 顶点 联接 起 来 . 

构造 G' 的 基本 原则 是 : 对 G 的 一 棵 生成 树 T， 每 条 非 树 边 eeE — E' 确定 了 G 的 一 
条 基本 回路 。 同 一 条 基本 回路 上 的 边 在 同一 个 双 连 通 分 支 内 。 我 们 添加 足够 多 的 边 到 G 
中 ， 使 得 对 应 G 的 一 条 回路 的 所 有 边 在 G' 的 同一 个 连通 分 支 内 。 

在 图 8.5 中 ， 给 世 了 一 个 无 向 连通 图 G(V,EY. V= 11 和 它 的 双 连 通 分 支 ，G 的 双 连 
通 分 支 在 图 (bp) 示 出 .图 8.6 给 出 了 图 G 的 辅 图 G^ 的 构造 过 程 。 图 (a) 含有 G 的 一 棵 生成 
树 ， 图 (D) 是 构造 的 结果 一 一 HEC. 
定理 8.6” 设 G(V,E) 是 一 个 无 向 连通 图 。T(V,E 人 是 G 的 一 棵 生成 树 ， 则 G 的 两 条 边 在 
同一 双 连 通 分 支 内 ， 当 且 仅 当 G^ 中 对 应 这 两 条 边 的 顶点 在 同一 连通 分 支 内 。 
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证 明 对 任意 一 条 边 (x,y)e E-E'. EX G 的 一 条 简单 回路 ， 即 {x,y) 所 在 的 基本 回路 .所 
有 的 基本 回路 组 成 了 基本 回路 集 Q。 图 G 的 任意 一 条 回路 都 是 由 Q 内 的 一 些 元 素 的 “ 环 和 
Qi. 

定义 关系 RH: eRe, SARA el 5j e; Re G H-REARM EY). SR ERK 
自 反 传递 半 包 .我 们 可 以 断言 R'" —R. RERA RE E ERU EXE, HARER, 
所 以 R'* ER。 接 着 再 证 明 RR. # eRe, Ne Got G 的 同一 条 简单 回路 C 上 。 
而 C 是 由 有 的 一 些 元 素 环 和 而 成 ， 即 C=C@ COC CGS, l<ick. 不 失 一 
RHE, HEC). Cp s C, 具有 这 样 的 性 质 : 使 得 C, (i> 1) 至 少 与 某 个 C U <i) 有 一 条 
公共 边 , 那么 ， 通 过 对 进行 归纳 ， 我 们 很 容易 证 得 在 R 内 C, Co e C 的 边 是 等 
tri, Ble, R'en S RCR'". AERE Ro R RE. 


ALD 


ucu.n 


100. 10) 


” : 
4 
(b) ET] {3.41 
D 5 5 u 
s *——. 14,8) (4.51 
5 
17.8 (67 ‘NZ 
? ` . . 
10 
. 
& {8.9 17.9} 15.10 


(2) 无 向 图 G (a) GER 

O Hc 的 双 连 通 分 支 (虚线 为 非 树 边 ， 括 号 中 数 
QUA. 5. 6 和 ?是 关节 点 ) 分 别 是 low # high 值 ) 
Gh(5,7). (5,10)1,1 W) [OE HEE 


图 8.5 无 向 图 的 双 连 通 分 支 及 关节 点 图 s6 GRRR G' 的 构造 过 程 
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令 (av) R (xw) E GAB TL, ERDRE, W (u,v) 在 (x,w) 定义 的 基 
本 回路 上 (x= y) FREDRE, W (u,v) 及 (xw) 在 (v,w) 定义 的 基本 回路 上 。 若 条 
件 3) 成 立 ， 比 如 说 ，(y,z) 是 这 样 的 一 条 边 ，y 是 w 的 一 个 子孙 ， 而 z 不 是 v 一 x 的 一 个 
FH, BA (u,v) 及 (x,w) 在 (y,z) 定义 的 基本 回路 上 。 因此， 在 任何 条 件 下 ，(w,v) 
及 (x,w) SE G 的 同一 个 双 连 通 分 支 内 。 

反之 ， 令 (xylek- ED CHMT RBM (x,y) 的 基本 回路 4 z 一 LCA(x,y)。 不 
失 一 般 性 ， 假 定 pre(x) < pre(y)，、 和 根据 条 件 1)，(x,y) 及 EO 在 G^ 中 是 邻接 顶点 .又 
由 条 件 3) 可 知 ， 边 (x,y) 一 定 存在 ， 这 就 意味 着 : 在 树 上 从 x 到 LCA(x,y) 路 径 上 的 任何 
两 条 边 ， 对 应 在 G' 上 的 顶点 都 是 邻接 顶点 。 类 似 地 ， 在 树 上 从 ?到 LCA(x,y) 路 径 上 的 
任意 两 条 边 ， 对 应 在 G^ 上 的 顶点 都 是 邻接 项 点. 若 z = x， 则 在 树 中 从 x 到 z 的 路 径 为 
Z5; SIAM Ex Sy Ry 4 x 均 不 成 立 .， 又 由 条 件 2) 得 (F(x),x) 及 (Fl(y),y) 在 G' 中 
是 邻接 顶点 。 因 此 ， 同 一 条 基本 回路 土 的 边 在 G 的 同一 个 连通 分 支 内 。 


算法 8.4 BICONNECTIVITY ALGORITHM BY EULER TRAVERSAL 

输入 : BG(VQEMSARER, BV = {1.2m}, Xu, PeEN AAA eS ij 
和 < ji> 表示 , jey; 

输出 : 图 G 的 双 连 通 分 支 。 

begin 

(1) 构造 G(V,E) 的 一 标 生 成 树 T(V,E)， 计 算 每 个 顶点 veV 在 T 中 的 先 序 标号 pre(v) 
及 其 子孙 个 数 nd(y) 3; 

Z * 一 个 顶点 # 是 只 一 个 顶点 ?的 子孙 ， 当 且 仅 当 prefv) < prelu) < pre(v) + nd(v) — 1, 
其 中 nd(y) 可 通过 对 了 后 序 遍 历 得 到 ，nd(Y)=1+ Yo nd(w)， (y 是 它 自己 的 


(Fa ee 


amar 
子孙 . ) * / 

(2) 对 每 个 项 点 ve V， 计 算 最 小 先 序 标号 顶点 low(y) 及 最 大 先 序 标 号 顶点 high(v); 它 
们 满足 : 


low(v) = {u | minfpre(v), low(u) | v ^w T8933, VweE—- EX; 
high(v) = fu | max{pre(v), low(u) | v» uz& TK 33, (vuje E — E'13; 
/* 可 以 通过 对 了 后 序 遍 历 得 到 * / 

(3) 构造 G/ 的 一 个 子 图 G”"，G” 的 顶点 由 了 的 边 组 成 ，G" 的 边 由 满足 条 件 2) 及 条 忻 3) 的 

边 组 成 。 对 每 条 边 (w,y)e 忆 一 E'， 著 pre(y)+ nd(v) < pre(w)， 则 把 边 

(F(v)v), (FCW),w)) 加 入 到 G' 中 ; 

7 * 按 条 件 2)* / 

(4) 找 出 G* 的 连通 分 支 ; 
O 将 T 上 边 的 等 价 关 系 扩 展 到 非 树 边 eeEE 一 EE 上 去 ， 对 每 一 条 边 e = (vuje E 

— E', Hpre(v) < pre(w)， 定 义 (y,w) 等 价 于 (F(w),w) 

7 sR y 

w. 
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843 算法 在 SIMD 共享 存 贮 模型 上 的 实现 
Tarjan 等 人 在 SIMD — CRCW PRAM 上 ， 实 现 了 算法 8.4. 得 到 一 个 O(logm) 
= Oflogn) 时 间 、O(m + n) 处 理 器 的 并 行 算法 。 

设 算法 的 输入 表示 为 : V — (1,2, n). GV, E) MERA (,J)e E 用 两 条 方向 
相反 的 并 行 有 疝 边 <i,j> 及 < ji> BR. 每 个 顶点 ieV 有 一 个 射出 边 的 链表 ， 其 
中 adji) 是 表 头 指针 ， 指 向 的 第 一 条 射出 边 < i,j> ， 或 者 当 i 没有 射出 边 时 ， 表 头 措 
针 为 空 (NULL). 车 还 有 从 i 出 发 的 射出 边 ， 则 next < 产 > ) 指向 该 射出 边 ; 否则 ， 
Binext( <i,j> ) 为 空 。 此 外 ， 每 条 边 < i,j> 还 有 一 个 指针 指向 边 < 大 > 。 对 每 个 顶点 i 
和 每 条 边 ij 都 分 派 一 个 处 理 器 ,分别 是 PE(i)，PE(i,j), 1 < jgn。 

算法 8.4 的 第 (1) PRAMAS A REM (VE), IX Re HIE 5.2 
及 Shiloach 算法 中 直接 得 到 ， 需 Oogn) 时 间 、O(m + 如 处 理 器 、 但 这 样 产生 的 一 棵 生 
成 树 T， 它 还 没有 根 ， 我 们 指定 一 个 顶点 为 树 根 ， 然 后 在 这 棵 根 树 上 计算 每 个 顶点 v 的 先 
序 标号 pre(v) 及 子孙 个 数 nd(y)，veV。 为 此 ， 我 们 将 树 边 也 用 邻接 表 形 式 存 贮 。 具 体 的 
构造 过 程 如 下 : 


算法 8.5 CONSTRUCTING LIST OF TREE 
WAL 图 G(V,E) 的 邻接 表 ，V -(L2, nhi 
输出 : G 的 一 标 生 成 树 T(V, ES BRA, 
procedure Incident__List__Tree ; 
begin 
(1) for cach i,j: (i, j)eE pardo 7 * 赋 初 值 * / 
(1.D) treenext( < i, / > }« next( < i j >); 
(1.2) treenext( < ji» ) e next(« ji» ) 
endfor ; 
(2) for k — 1 to llogm! do 
(2.1) for each i, j: (i, j)e E pardo 
(2.1.1) if (treenext( < i, j>)+ NULL) and (treenext( < i, j>) E") 
then treenext( <i, j > ) e treenext(treenext( <i, j >) 
endif ; / * ALA RA bs T AE Ed AB ARAL / 
(2.1.2) if (treenext( < 大 > ) NULL) and (treenext( < j, i» )¢E’} 
then treenext( < j,i > )« treenext(treenext («hi») 
endif 
endfor 
endfor ; 
(3) for each i: 1 <i<a pardo / * 构造 树 的 邻接 表 表 头 * / 
if (adj(i) = NULL or (adii)eE’) 
then treead Xi) «adii) 
else trecadyi) — treenext(ad\i)) 
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8.4.3 算法 在 SIMD 共享 存 贮 模型 上 的 实现 

Tarjan 等 人 在 SIMD — CRCW PRAM 上 ， 实 现 了 算法 8.4. 得 到 一 个 O(logm) 
= O(logn) NTT). O(m + n) 处 理 器 的 并 行 算法 。 

设 算法 的 输入 表示 为 : ”= 和 1, 2,…, n}，G(V, E) 的 每 条 无 向 边 GL) e E 用 两 条 方向 
相反 的 并 行 有 向 边 <i,j> 及 < ji> 表示 。 每 个 顶点 ieV 有 一 个 射出 边 的 链表 ， 其 
中 adji) 是 表 头 指针 ， 指 向 i 的 第 一 条 射出 边 < i,j> ， 或 者 当 没有 射出 边 时 ， 表 头 指 
HAD (NULL), HEHA i 出 发 的 射出 边 ， 则 next( < pi>) 指向 该 射出 边 ; 否则 ， 
置 next <i,j> ) 为 空 。 此 外 ， 每 条 边 <i,j> 还 有 一 个 指针 指向 边 < 让 > 。 对 每 个 项 点 i 
和 每 条 边 < i,j> 都 分 派 一 个 处 理 器 ,分 别 是 PE(?)，PE(i,j), 1 <ij<n. 

算法 8.4 的 第 (1) 步 实现 首先 是 构造 一 村 生成 树 T(Y,E')， 这 可 运用 推论 5.2 
及 Shiloach 算法 ”直接 得 到 ， 需 O(logn) 时 间 、O(m +n) SMB. (ROR E BLE 
成 树 T， 它 还 没有 根 ， 我 们 指定 一 个 顶点 为 树 根 ， 然 后 在 这 榜 根 树 圭 计算 每 个 顶点 v 的 先 
序 标号 pre(v) 及 子孙 个 数 nd(v)，veV， 为 此 ， 我 们 将 树 边 也 用 邻接 表 形 式 存 贮 。 具 体 的 
构造 过 程 如 下 : 


算法 8.5 CONSTRUCTING LIST OF TREE 
输入 : 图 G{V,E) 的 邻接 表 ，V = 11,2, n); 
输出: GRE RBT(V, EVER, 
procedure Incident List. Tree; 
begin 
(1) for each i,j: (i, j)eE pardo / * aani y 
(1.1) treenext( < i, j > )— next(« i, j>); 
(1.2) treenext( < i )e next(< ji») 
endfor ; 
(2) for kel to l'logm! do 
(2.1) for each i, j: (i, j)e£ pardo 
(2.1.1) if (treenext( < i, /» ) € NULL) and (treenext( < i, j> )é E^) 
then treenext( < i, j > )< treenext(treenext( <i, j >) 
endif ; / * 跳 过 每 条 树 边 的 下 一 条 非 树 边 的 邻接 边 * / 
(2.1.2) if (trecnext( < 127 ) # NULL) and (treenext( < j, i> )éE") 
then treenext( < j,i > ) — treenext(treenext (< j, i» )) 
endif 
endfor 
endfor ; 
(3) for each i: 1 <i<n pardo / * 构造 树 的 邻接 表 表 头 * / 
if (adj?) = NULL or (adji)e E^) 
then treeadj(i) — adii) 
eke trecadi(i) — treenext(ad{i)) 
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pre(k,) = min {pre(local_low(k’)) | pre(/) < pre(k’) < pre(j) + nd(j) — 1 


划 low(/)=k,. 
为 了 计算 每 个 jey 的 low(j)， 我 们 定义 一 个 顶点 辅助 数组 T， 开 始 时 I0) 5 然后 
对 每 个 顶点 的 先 序 标号 按 非 降 次 序 排序 。 在 排序 过 程 中 ， 若 prel) 与 pre(7) 交换 位 置 时 ， 
Ju 10) 5 IG) 也 跟着 交换 位 置 ， 在 排序 结束 后 ， 令 得 到 的 先 序 标号 数组 为 PRE; 然后 每 
个 处 理 器 j 在 数组 PRE 上 执行 二 分 法 搜索 ， 以 确定 7 在 这 个 数组 上 的 位 置 locate(j)。 
则 Iocate(/)) = j} 所 以 ,车 
pre(/(k ,)) = min {pre(local_ low(1(k’)) | locate(i) < k’ < locate(i) + nd{i) — 1} 


则 
low(j) = Itk,) 
不 失 一 般 性 ， 假 定 n 是 2 的 赛 ， 又 定义 一 个 辅助 数组 global low: 
global low(i,j) = local_low(I(k. oD 
其 中 : 
pre(local__low(i(k ,))) = min {pre(local_low(I(k’)) | i<k/ <j}, ijev 


由 此 可 知 ， 顶 点 FG), 8+ 1), +, I() 中 的 local low 值 最 小 的 顶点 local. low(I(k,)), i 
<k <i BÆ global low(i). global low 的 计算 过 程 如 下 : 


算法 8.6 COMPUTING GLOBAL LOW 
输入 : pre(1: n) Al local. low(1: n); 
输出 : global low(l:n). 
procedure Compute__giobal__ low ; 
bepin 
(1) for each i: i&<i<&<n pardo 
global low(i,i)«-local low(I(i)) 
endfor ; 
(2) for {—1 to loge do 
for cach k: O«k«n/2'—1 pardo 
if pre(global low(k2' + 1, (2k 一 i» ys 
pre(global low((k— 12^, (k + 12^) 


1-1 


then global low(k2', (k + 1)2') e global. low((2k — 12^, 


(k + 132) 
else global. low(k2' + 1,(k + 1)2')«- global_low(k2' + 1,(2k — 12^) 
endif 
endfor 
endfor 
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end. 


在 数组 了 上 计算 出 global low 后 ， 即 可 计算 low(7)， 关 YY。 只 要 注意 到 locate(7())) 
=f 则 顶点 FA+ 1), 1+ 2), I+ ndGg)- 1 都 是 7 的 儿子 顶点 。 因 为 对 任意 一 
Ak, pre(j) < pre(I(k)) < pre(j) + nd() 一 1， 所 以 计算 low(j) Æt IPA locate(j) 
Bl locate(j} + nd(j) 一 1 这 一 段 上 进行 的 每 个 low(7) 的 计算 过 程 如 下 : 


算法 8.7 COMPUTING LOCAL LOW 
输入 : locate(1: n) 及 nd(1: 1) ; 
RE: low(i), l<icn. 
procedure low ; 
begin 
(1) for each i: 1 «ix n pardo 
Ki) locate(i) ; h(i)« locate(i) + nd(i) — 1; 
low(i)en 41; /o4EXdEX—MXTuMES/ 
Tlag(i) + true / * ftag( 六 为 假 时 ， 表 示 low 人 (人 已 经 算出 * / 
endfor ; 
(2) for k 1 to logn do 
for each i:(1&i& n) & flag(i) pardo 
(2.1) if (() — 1) mod 2* #0 
then if pre(global__low(/(#), (i) + 2" — 1)) < pre(low( 
then low(i) + global low(i(2), (i) + geo 1x 
Hie (0) 4 2577 
endif 
endif ; 
(2.2) if A) mod 2* 40 
then if pre(global__low(A(i) — 2571, 1, h())) < pre(low(i)) 
then low(i)« global. low(h(i) — 2^ + 1, A() 


endif 
endif ; ` 
(2.3) if (i) (i) then Dag(i) — false endif 
endfor 
endfor 
end. 


显然 ， 对 每 个 顶点 六 过程 low(7 ) 的 计算 时 间 只 需 O(logn) 且 使 用 的 处 理 器 数目 
8 O(n). 而 high) 亦 是 类 似 的 。 
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算法 的 第 (3) 步 构造 辅 图 G"， 仅 需 0(D ATE]. Om) 处 理 器 ， 这 是 因为 每 条 边 赋予 
了 一 个 处 理 器 ， 每 条 边 的 测试 仅 禹 OC) 时 间 . 

算法 的 第 (4) 步 寻 找 G” 的 连通 分 支 ， 可 以 采用 第 四 章 介绍 过 的 算法 ， 需 O(logn) 时 
间 、O(n + m) 处 理 器 。 这 是 因为 G" 的 顶点 数 即 是 树 的 边 数 ， 所 以 同一 个 连通 分 支 的 顶 
点 都 有 相同 的 DD (8. 

算法 第 (5) 步 特 树 边 上 的 等 价 关 系 推广 到 非 树 边 集合 一 E 上， 车 对 每 条 边 < i,j> 
A pre(i) «pre(/), <i,j> eE, Bl D( «ij» ) - D« Fü),j» . 这 一 步 需 0O(1) 时 
E. O(m) 处 理 器 . 
定理 8.7 在 SIMD 一 CRCW PRAM 上 ,计算 一 个 无 向 连通 图 G(V,E), |V| — 的 双 连 
通 分 支 ， 算法 8.4 需 O(logn) 时 间 、O(n + m) 处 理 器 , 
证 明 ”在 算法 8.4 中 ， 第 (1) 步 构造 G 的 一 标 生 成 树 T， 需 O(logn) 时 间 、O(n + m) 处 
理 器 ， 而 利用 欧 拉 遍 历 技 术 计 算 树 顶 点 的 先 序 标号 ， 子 孙 个 数 ， 需 OQogn) RE. O(n) 
处 理 器 ; 第 (2) 步 需 O(logn) 时 间 、0O (maxfn,m}) = O(m) 处 理 器 ， 第 (3) 98 0(1) 时 
Wl. O(m) 处 理 器 ; 第 (4) 步 需 O(logn) BY. O(n + m) 处 理 器 ; 第 (5) 2595 0(1) 时 
TJ. O(n) 处 理 器 . 故 整个 算法 需 O(logn) Ht. O(n + m) 处 理 器 ,， 
推论 8.2 在 SIMD — CREW PRAM 上 ， 对 一 个 无 向 连通 图 G(Y,E), IV| 9 n. # G ff 
输入 是 邻接 矩阵 表示 ， 则 求 G 的 双 连 通 分 支 算法 84, O(n / K+ log n) INE]. O(nK) 
处 理 器 (K > 1). 
证 明 ”算法 8.4 的 第 (1) 步 构造 生成 树 了 及 第 (4) 步 计算 G” 的 连通 分 支 ， 由 定理 4.5 及 
推论 5.1 得 知 ， 完 成 这 工作 需 O(n / K + logn) 时 间 、0O(nK) 处 理 器 ; 而 算法 的 第 (3) 步 及 
第 (5) 步 可 采用 分 组 技术 ， 每 个 处 理 器 至 少 有 O(n”/ nK) = 0(n / K) 条 边 ， 故 完成 这 两 
步 各 需 O(n KHA. O(nK) 处 理 器 ; 在 第 (D 步 计 算 每 个 树 顶 点 的 先 序 标号 、 子 补 个 
数 和 第 (2) 步 计算 low 及 high 的 值 ， 都 要 求 树 用 邻接 表 形 式 存 贮 . 具体 实现 如 下 : 首先 
通过 G 的 邻接 和 矩阵 构造 G 的 邻接 表 , 对 G 的 边 按 字典 序 进行 排序 ， 采 用 Cole Si" 
需 O(logm) 时 间 、0O(m) 处 理 器 ; 然后 将 排序 后 的 边 序列 构造 成 邻接 表 ; 再 按 本 节 开 始 叙 
述 的 ， 从 G 的 邻接 表 (又 称 出 边 表 ) 中 构造 出 树 的 邻接 表 ， 需 O(logm) 时 间 、O(m) 处 理 
器 . MOB (1) 步 中 的 计算 先 序 标 导 和 子孙 个 数 及 整个 第 (2) 步 计 算 ， 需 O(logm) = O(logn) 
WR. Oon +n) 处 理 器 。 所 以 ， 整 个 算法 8.4 需 要 O (log n n / KHR OK) 处 理 
器 . 这 同 定理 8.5 的 结论 是 一 致 的 . 


8.5 桥 的 算法 


8.5.1 桥 的 基本 性 质 
设 G(V,E) 是 一 个 无 向 连通 图 ，V 一 (1,2, n). 车 从 图 G 中 删除 边 ee 已 之 后 ，G 
就 不 连通 ， 则 边 。 称 为 G 的 一 座 桥 (Bridge)。 例 如， 在 图 8.5 中 ， 图 G 是 连通 的 ， 若 删 去 
边 (6,7)、 或 边 (5,10)、 或 边 (5,11)， 则 留 下 的 图 就 不 再 是 连通 图 ， 故 边 (6,7. (5,10) 
和 (5.10 是 图 G 的 桥 - 
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4 GREER T(V,E^, BTM <i, FG)> ek, ieV. BU T DRE 
式 存 贮 ， 其 中 根 " 有 Fo) or. WEAR EE — 如， 把 它 加 入 到 了 中 ， 则 形 
成 G 的 一 个 基本 回路 C. 由 于 从 C 中 去 掉 非 树 边 e 后 并 不 影响 图 G 的 连通 性 ， 故 边 。 不 
可 能 是 G 的 桥 ， 因 而 只 有 生成 树 的 边 < iF(i) > E’ 才 有 可 能 成 为 G 的 桥 . 那么 什么 样 的 
树 边 才 是 G 的 一 座 桥 呢 ? 请 看 下 面 的 定理 ， 
定理 8.8 AVE 是 一 个 无 向 连通 图 G(V LE) 的 一 棵 生成 树 。 对 任意 一 条 树 边 
«iF()»eE', (+r) EG 的 一 座 桥 ， 当 且 仅 当 这 条 边 是 的 子孙 和 非 半 子孙 之 间 的 唯一 
连接 边 。 即 对 让 的 任何 子孙 六 在 5 中 不 存在 这 样 的 边 (jk)， 其 中 此 不 是 i 的 子孙 ，i 
ev. 
证 明 $ o cLF) 是 G 的 一 座 桥 。 若 存在 这 样 一 条 边 (jk)eE 一 E',， 且 j 是 i 的 子 
3h. 大 不 是 ;的 子孙 . 那么 在 树 了 中，z 一 LCA(K, 站 是 j 和 上 的 最 低 公 共 祖先 ， MAW 
不 是 1 的 子孙 ， 所 以 z 必然 也 是 i 的 祖先 。 玖 在 树 了 中 边 < PEFGD > Æ JA z PEE. 
车 将 边 UO 加 入 到 工 中 ， 则 形成 G RBA CS BR <L> ECE, 
MC ELEM <i, F(i) > 并 不 影响 G WEE. K <i, F(i) > 不 是 桥 。 这 就 与 
«i,F()» REESE. 

反之 ， Kies <i Fi) > ck’ 是 一 条 树 边 ， 它 是 i 的 子孙 和 非 i 子孙 之 间 的 唯一 连 
EA. S i 的 子孙 顶点 集合 = fu | i 4 在 工 中 }， 则 非 i 子 孙 顶 点 集 为 VY 一 U. 车 
AAG 中 删除 边 e 以 后 ， 则 任意 顶点 xeU 和 顶点 yeV — U 之 间 不 存在 路 径 ， 即 G 变 成 不 
连通 了 .根据 桥 的 定义 ， 所 以 e 是 G 的 一 座 桥 . 

根据 定理 8.8, Savage 在 SIMD 一 CREW PRAM 上 , 给 出 了 一 个 计算 G 的 桥 
HAM, WAR O(log n) MA. O(n’ logn) 处 理 器 ， 这 里 我 们 介绍 Tsin 等 人 外 给 出 的 
另 一 个 算法 。 
定理 8.9 HIVE) 是 无 向 连通 图 GOUE) 的 一 村 生成 树 ， 且 用 北 树 形式 存 贮 。 对 任意 
一 条 树 边 < FU)» ek, izr, 是 树 根 顶 点 ，<iF(i) > 是 G 的 一 座 桥 ， 当 且 仅 当 i 的 
任意 一 个 子孙 w， 在 G 中 不 存在 非 树 边 (u,v)eE — E' H depth(LCA(u,»)) < depth(i). 
WRA QANA < i,F(i) > ur 是 G 的 一 座 桥 。 若 存在 一 条 边 (4,v)eE 一 E' 且 ww 是 在 T 
中 的 子孙 ， 而 且 还 有 depth{LCA(w,v)) <depth(i)， 即 么 将 边 Qv) 加 入 了 中 后 ， 在 树 中 
Au 到 LCA(u,v) 的 路 径 、 从 LCA(w,v) 到 + 的 路 径 和 边 (u,v) 形成 一 条 包括 边 (uv) 的 基 
本 回路 ,而 边 <iF() > Æ uP LCA) BBL. 这 同 <L> 是 G WHEE. 

反之 ， 着 边 eeE 不 是 桥 ， 则 它 属于 某 条 基本 回路 。 如 果 e (u,v)#E 一 至， 那么 在 
HTP, Ue RE v 到 LCA(usv) 路 径 上 ， 或 在 LCA(wu,v) Sl u 的 路 径 上 。 这 就 意味 着 : 

depth(u) > depth(i) > depth(F(i)) > depth(LCA(w,v)) 


或 

depth(v) > depth(i) > depth(F()) > depth(LCA(u,v)) 
在 任何 一 种 情况 下 ， 痢 至少 存在 一 条 边 (u,v)eE — E' Hu BIW TH, depth(LCAQ v) 
« depth(i). 


8.52 算法 的 非 形式 化 描述 
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算法 8.8 BRIDGES ALGORITHM 
输入 : 无 向 连通 图 G(V,E), |V| = 站 的 邻接 矩阵 ; 
Mh: G 的 所 有 桥 。 
begin 
(1) REG EYR TOEN 
(2) «EE GAS EAT Avev, HXHLCA(Q); 
(3) 对 每 个 顶点 veV， 计 算 a(v)， 其 中 : 
a(v) = minfdepth(HLCA(w)) | v&w 在 7 中 } ; 
(4) 检查 每 条 树 边 < i,F(i) > eE', FU < i,F(i) > 是 桥 ， 当 且 仅 当 depth(i) < ali) 


end. 


定理 8.10 在 SIMD — CREW PRAM 上 ,计算 一 个 无 向 连通 图 G(V,E), V= n 的 全 部 
桥 ， 算 法 8.8 O(n /K+1og*n) 时间、O(nK) 处 理 器 。 
证 明 ”算法 8.8 的 第 (1) 步 可 应 用 第 四 章 的 最 优 连通 分 支 算法 及 Sollin 算法 求 得 ， 由 定 
理 4.5 及 推论 5.1 知 ， 这 一 步 需 O(n / K log n) Ml. O(nK) 处 理 器 ; 算法 的 第 (2) 步 
由 定理 8.3 知 ， 需 O(n / K+ logn) 时 间 、O(nK) 处 理 器 (K 2 1) 第 (3) 步 实现 如 下 : 根 
据 第 (2) 步 已 算出 的 矩阵 FS KE depth. 对 每 个 j, 3 F' KA » — 1 WB 
第 depth(/) 列 ， 若 j 在 第 i 行 出 现 ， 则 i 是 7 的 一 个 子孙 ， 故 这 一 步 计 算 需 O(2 K 
十 log 站) 时 间 、O (nk) 处 理 器 ; 最 后 一 步 需 0(1) STR. O(n) 处 理 器 。 故 整个 算法 
$88 O(n / K+ log^n) 时间 、O(nK) 处 理 器 (kK > D. 
另 一 种 求 桥 的 方法 是 : 可 利用 图 的 双 连 通 分 支 算 法 直接 地 求 得 桥 ， 由 单条 边 组 成 的 
双 连 通 分 支 的 那 条 边 都 是 桥 ， 由 于 篇 申 所 限 ， 在 此 不 再 介绍 了 。 


8.5.3 ”二 维 网 孔 上 的 桥 算法 
Atallah 4& AP 曾 给 出 二 维 网 孔 上 的 桥 算法 ， 设 图 G(V,E)，|V| =n 是 一 个 无 向 连通 
图 ， 设 二 维 网 孔 上 有 n MERR QARA (ij) 上 的 处 理 器 为 PE。 在 处 理 恬 PE， 


中 ， 若 终止 时 的 flag(i,j) = 1， 则 图 G 的 边 (i, 站 是 一 座 桥 (1 Sijan) 
4 S.D RREG 中 顶点 i 到 顶点 j 的 最 短路 径 长 度 ， 且 这 条 最 短路 径 到 多 经 过 k 
HDL. 若 i 和 j 之 间 不 存在 一 条 有 限 长 度 的 路 径 , RES) o. 1<ijk<n. 


令 


l, # (jek 
S.D ls Hin; 
co, 否则 


引 理 8.10 ”在 SIMD 二 维 网 孔 模型 上 ， 计 算 一 个 无 向 连通 图 G(Y,E), IV| = HERRI 


生成 树 ， 需 要 O(n) IN. O(n”) 处 理 器 。 
证 明 ”不 失 一 般 性 ， 假 定 Y — (1,2, nl. BUS 1 作为 树 根 ， 首 先 计算 从 根 出 发 到 其 它 
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所 有 顶点 je V 的 最 短路 径 S,(1,j)， 由 定理 6.4 可 知 ， 这 一 步 需 O(n) 时 间 、 O(n?) 处 理 
a HK, F level) = S (00,0, (S, (,0 — S, (i,1))， 每 个 处 理 如 PE 做 纵向 广播 ， 
将 level(7 ) 的 值 送 人 第 7 列 的 全 部 处 理 器 PE， 中 (1 < i< on). 类 似 地 ， 每 个 PE 
de lcvel(i) 广播 到 第 i 行 的 所 有 处 理 器 PE, 中 (1 < j< 站。 这 样 做 的 结果 , 每 个 处 理 
PE, 里 含有 level(i) 及 level(j) MA; 第 三 ， 我 们 定义 : FG)— min(j | (i,j)eE 
B levei) = level) +1}, 141. 接着 计算 所 有 顶点 ie V 的 FG). SERA EIE UP. EJ 
需 O(n) 时 间 、0O(n”) 处 理 器 . 这样 ， 我 们 获得 一 个 有 向 宽度 优先 生成 树 TV). 最 后 
一 步 ， 计 算 和 T(V,E') 对 应 的 无 向 图 T'(V,E ) 的 邻接 矩阵 具体 实现 是 : 假设 算出 
的 FG) 存放 在 PE, H. D 每 行 处 理 器 做 横向 广播 ， 将 F(i) 送 人 每 个 处 理 器 PE,, 中 (1<j 
xny 2) 每 列 的 处 理 器 做 纵向 广播 ， 将 FCA) 送 人 每 列 的 处 理 吕 PE, Pin) 3) 
HANH j= FO) 或 ;= F() 时 ， 则 处 理 器 PE, E TGJ 1， 实现 了 上 述 各 步 后 ， 就 获 
得 了 G 的 一 个 以 顶点 1 为 根 结 点 的 无 向 宽 度 UL 先生 成 树 TA《V,E,)， 又 因 每 步 
FOM, O(n?) AMBRE, MORE REAR O(n) UT, O(n”) 处 理 器 . 

SG" 是 G 的 传递 闭 包 。 定 义 集合 Re 为: R,Q-([I 在 G 中 存在 i 到 j 的 
路 径 y. 
58 &11 TVA G BJ — BERE. TV E)E 工 对 应 的 无 向 图 ，(i,j )e E, A 
G'-(G-T'YO T, FUL) J& G WH, SAMY Ri )= ReG). 
证 明 车 i=F(j) 有 (i,j )eEl 是 G 的 一 座 桥 ， 则 在 边 
集合 EE 中 不 存在 这 样 的 边 ， 它 将 j 的 子 树 顶点 
(包括 j yel j 的 非 子 树 顶点 连接 起 来 ，( 如 图 8.7 fiis 
线 所 示 ). BOR RAG )= ReG Y. 

如 果 FGE RAj)= Roe(j)， 那 么 在 E-E, 
中 不 存在 一 条 连接 ;的 子 树 顶 点 到 ;的 子 树 之 外 的 顶 
AMH. BGG EEM G 中 删除 后 ， 将 使 G 不 再 是 
连通 的 ， 所 以 边 (i,j ) 是 G 的 一 座 桥 . 
有 了 上 面 的 概念 及 引 理 ， 现 在 我 们 介绍 关于 桥 的 算法 .。 


图 8.7 存在 桥 时 ， 逆 树 中 顶点 
和 非 树 顶点 的 连接 


算法 8.9 BRIDGES ALGORITHM ON MESH ARRAY 
BA: 无 向 图 G(V,E) 的 邻接 短 阵 4。 处理 器 PE 的 单元 4(i,j) 存 贮 短 阵 4 的 一 个 元 
*: 
输出 : BG eut. Bfag(i,/)=1, 册 处 理 器 PE, 标 明 边 (ij) 是 桥 。 
begin 
(1) 计算 无 向 连通 图 G(V,E) 的 有 向 宽度 优先 生成 衬 T(V,E) 及 对 应 的 无 向 树 TAV,E,) 
SARE ES 
(2) 构造 子 图 GA(V, 局 其 中 = EO (E-E): 
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(3) 计算 G/ 及 了 的 传递 闲 包 G/ AT” ; 

(4) FEDE IGPIBEARAUERET GEHT ARAS REG 的 第 行 是 否 相等 ? 
然后 通过 水 平 旋转 收集 “相等 ” 私 “ 不 相等 ”的 信息 存放 在 PE ,中 。 落 相等， 
WIPE ,送出 标志 PE APE, nn 的 Bag 为 1， 即 (F(7》 Dek, 是 G 的 桥 


end. 


定理 8.11 SIMD 二 维 网 孔 模 型 上 ， 计 算 一 个 无 向 连通 图 G(V,E)，|V1= # 的 所 有 
桥 ,算法 8.9 9 OQ HTT, O(n") 处 理 器 ， 

证 明 ”算法 8.9 的 第 (1) 步 ， 根 据 定理 6.4， 需 O(n) ML. O(n^) 处 理 器 ; 算法 的 第 (2) 
步 需 0(1) ITD, O(n”) 处 理 器 ; 第 (3) 步 由 定理 6.4 知 ， 亦 需 O(n) EDI. O(n”) 处 理 
器 ; 第 (4) 步 广播 需 Om, O(n) 处 理 器 。 标 识 桥 需 OQ NL, O(n”) 处 理 器 . 故 
整个 算法 需 O(n) 时 间 、O(n”) 处 理 器 ， 


8.6 双 连 通 分 支 算法 的 应 用 -一 求 图 的 关节 点 


前 面 我 们 描述 了 求 图 的 双 连 通 分 支 算法 8.3， 现 在 介绍 如 何 从 求 得 的 双 连 通 分 支 来 决 
定 图 G(V,E) 的 关节 点 集 ， 众 所 周知 ， 如 果 顶 点 a 不 是 G 的 生成 树 了 的 根 WA, a 
是 G 的 一 个 关节 点 ， 当 且 仅 当 对 某 一 个 了 来 讲 ，B ,是 G 的 一 个 双 连 通 分 支 且 4 是 TaB, 
的 根 顶点 ; 树 7 的 根 是 G 的 关节 点 ， 当 且 仅 当 r 至 少 是 两 个 不 间 的 子 树 TnB' 和 TnB” 
的 根 ， 其 中 B 和 B^ 分 别 是 G 的 两 个 不 同 的 双 连 通 分 支 。 

利用 上 述 的 观察 ，Tsin 等 人 曾 建 议 一 个 计算 G MATARAE. BR, KER 

不 详细 介绍 了 。 下 面 定理 的 证 明 ， 亦 概括 了 算法 的 主要 过 程 ， 
定理 8.12 ”在 SIMD — CREW PRAM 上 ， 求 一 个 无 向 连通 图 G(V,E)，|Y|=n 的 关节 
点 集 ， 需 O(n/ K log n) RY. O(nK) 处 理 器 (X > 1). 
证 明 ”首先 构造 G BG TOEN 其 次 确定 G 的 双 连 通 分 支 的 顶点 集 ， 这 一 步 根 
据 定理 8.5， 需 O(n/ Klog n 时 间 、O(nK) 处 理 器 (K 2 1); 第 三 ， 确 定 每 条 有 疝 边 e 
= «ay EE’ 的 头 head(E) ( BU head(e) =v), X-A% 0(1) BEDS, O(n) 处 理 器 ; 第 
四 ， 将 所 有 头 (heade) 顶点 集合 分 组 ， 按 照 它们 所 在 的 双 连 通 分 支 顶点 集 来 分 组 ， 这 一 
步 可 通过 排序 解决 ， 而 排序 需 OQogz) NE. O(n) 处 理 器 ; 最 后 ， 每 组 头顶 点 中 depth 
值 最 小 的 顶点 ， 即 是 关节 点 。 树 根 是 关节 点 ， 当 且 仅 当 它 被 两 组 或 两 组 以 上 的 头顶 点 选 
作为 depth 值 最 小 的 顶点 ， 完 成 这 一 步 需 O(logn) MT. O(n) 处 理 器 ， 所 以 整个 过 程 
$88 O(n /K+ log ntt]. O(nK) AEH (K > 1). 
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8.7 小 结 


在 并 行 环境 中 ， 怎 样 迅 速 地 解决 无 向 图 的 一 些 基本 性 质问 题 ， 如 基本 回路 、 关 节 
点 、 双 连通 分 支 和 桥 等 ， 是 一 个 十 分 重要 的 问题 。 本 章 着 重 介 绍 了 它们 的 一 些 并 行 算 
法 。 主 要 内 容 有 : 基于 SIMD 共享 存 贮 模型 叙述 了 一 个 求 基本 回路 的 算法 ; 给 出 了 两 个 
采用 不 同 策略 的 求 图 的 双 连 通 分 支 算法 ; 基于 SIMD 共享 存 贮 模型 和 SIMD 二 维 网 孔 模 
型 ， 分 别 介绍 了 计算 图 的 所 有 的 的 算法 ; 最 后 讨论 了 怎样 利用 图 的 双 连 通 分 支 去 计算 图 
的 关节 点 . 

研究 图 的 一 些 基 本 性 质问 题 的 并 行 算法 ， 最 早 始 于 Savage”, HF SIMD 
— CREW PRAM 模型 ， 她 和 她 的 同事 利用 图 的 传递 闭 包 方法 ， 剖 给 出 了 Oog^n 时 
Bl. O(n?) 处 理 器 的 求 基本 回路 的 算法 ， 和 O(log’n) 时 间 、O(n? /logn) 处 理 器 的 求 双 连 
通 分 支 算法 ， 以 及 O(log n) 时 间 、O(n loge) 处 理 器 的 计算 桥 的 并 行 算法 "”，Tarjan 等 
人 在 SIMD — CRCW PRAM 上 给 出 求 双 连 通 分 支 算法 后 ， 还 建议 了 一 个 在 SIMD 
一 CREW PRAM 上 的 实现 算法 ， 该 算法 需 O(n’ / p Wl. O(p) 处 理 器 (1<p 
<n? / log/n)". Atallah 等 人 在 二 维 网 孔 模型 上 ， 还 叙述 了 一 个 OM. O(n?) 处 理 
器 的 求 关节 点 算法 中，Huang 曾 在 树 网 上 给 出 一 个 O(n^ / py IS. (o) 处 理 器 的 求 最 优 
双 连 通 分 支 算法 (1 < p< n^ / log^ n)". GK, Tsin 基于 SIMD — CREW PRAM 模 
型 ， 建 议 了 两 个 计算 树 中 每 对 项 点 的 最 低 公共 祖先 算法 ， 该 算法 可 计算 r 对 顶点 的 最 低 公 
dide. DH O((n +7 / Pilogn) IR O(n’ / p+ logn) 4838, 尤其 是 当 1<p 
<n /log'n 时 ， 利 用 求 最 低 公共 祖先 算法 ， 可 推 得 一 个 最 优 的 求 基本 回路 算法 中 .此 
外 ，Goshi 等 人 基于 一 维 线性 阵列 ， 给 出 了 最 优 的 计算 桥 及 关节 点 算法 ， 算 法 
On’ / py Wild. O(p 处 理 器 (< pco)", 

有 关 这 些 问题 的 并 行 算法 不 胜 枚 举 ， 这 里 介绍 的 内 容 ， 基 本 上 包括 当前 其 它 算法 的 
主要 思想 ， 由 于 舌 旺 缘 放 ， 在 此 不 再 叙述 了 .。 
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SAB ” 欧 拉 图 及 哈密 顿 图 的 并 行 算法 


9.1 找 欧 拉 回路 的 算法 


在 一 个 欧 拉 图 中 找 欧 拉 回路 的 问题 是 一 个 非常 古老 的 问题 。 在 单机 系统 上 人 们 已 经 
设计 了 许多 有 效 的 算法 .但 大 多 数 算法 基本 上 都 是 基于 同一 思想 : 即 把 图 的 边 集合 划分 
为 许多 回路 ， 然 后 将 那些 没有 公共 边 的 回路 “缝合 ”起 来 组 成 原来 殉 拉 图 的 欧 拉 回 
路 (Euler Cycle), 在 捉 行 算法 中 ， 这 些 回路 是 一 条 接着 一 条 顺序 发 现 的 ， 因 而 缝合 也 是 
顺序 进行 的 。 然而 在 并 行 环境 里 ， 虽 然 没 有 公共 边 的 回路 可 以 并 行 地 产生 ， 但 没有 一 种 
明显 的 办 法 将 所 有 的 回路 并 行 地 锋 合 起 来 ， 并 确信 稀 合 后 的 整 条 回路 就 是 欧 拉 回 
B. Awerbuch 等 人 及 Atallah 等 人 巧妙 利用 了 找 图 的 连通 分 支 及 MST 并 行 算法 ， 分 别 
在 SIMD — CRCW PRAM 上 给 出 了 一 个 0(logn) HE O(m + n) 处 理 器 的 找 欧 拉 回路 
的 并 行 算法 "”。 本 节 我 们 将 详细 介绍 Atallah 的 算法 


9.1.1 殉 拉 图 的 基本 概念 及 性 质 


E G(,E). |V| 2 n. |E| - m 是 一 个 无 向 图 , 车 在 G 中 存在 一 条 由 所 有 的 边 组 成 的 
路 径 ， 且 G 的 每 条 边 在 这 条 路 径 上 仅 出 现 一 次 ， 则 这 条 路 径 是 图 G 的 一 条 欧 拉 路 
径 (Euler Path)。 若 欧 拉 路 径 是 一 条 首尾 相连 的 路 径 ， 则 这 条 路 径 是 图 G 的 一 条 欧 拉 回 
路 ， 一 个 含 殉 拉 回路 的 图 称 为 欧 拉 图 (Euler Graph). 设 G(V,E) 是 一 个 有 向 图 ， 若 存在 一 
条 包含 所 有 边 的 路 径 ， 且 每 条 有 向 边 在 这 条 有 向 路 从 上 仅 出 现 一 次 ， 则 这 条 有 向 路 径 是 
图 G 的 一 条 有 向 欧 拉 路 径 . 若 有 向 欧 拉 路 径 形 成 一 条 有 向 闭合 路 径 ， 则 这 条 有 向 闭合 路 
PEA G 的 一 条 有 向 欧 拉 回 路 。 具 有 有 疝 欧 拉 回路 的 图 称 为 有 向 欧 拉 图 . 

殉 拉 图 有 许多 有 趣 的 性 质 。 这 里 仅 给 出 一 些 重要 的 基本 性 质 。 
引 理 9.1 (1) 无 向 图 G(V,E) 含有 一 条 欧 拉 路 径 ， 当 且 仅 当 G 是 连通 的 ， 且 G 仅 有 两 个 项 
点 度数 为 奇数 ， 这 条 欧 拉 路 径 是 从 这 两 个 奇数 度 顶 点 的 其 中 一 个 开始 到 另 一 个 结束 。(2) 
无 向 图 G(V,E) 含有 一 条 欧 拉 回 路 ， 当 且 仪 当 G 是 连通 的 ， 而 且 G 的 所 有 顶点 度数 均 为 介 
数 。 
证 明 DBE. RAG SARE, MATAR vie vege vie eye 
HH e ek, v,cV, 1<i<n, 0c j«m. 根据 殉 拉 路 径 定 义 ， 在 上 述 序列 中 的 顶点 可 以 
重复 出 现 ， 但 边 不 允许 重复 。 因 欧 拉 路 径 经 过 了 图 的 所 有 顶点 。 故 G 是 连通 的 ， 

在 欧 拉 路 径 中 ， 对 任意 一 个 非 路 径 端 点 的 顶点 ",， 每 当 它 出 现 一 次 ， 必 关联 着 两 条 
Xi. Mov, 虽 可 重复 出 现 ， 但 其 度数 dy) 必 是 偶数 .对 于 端点 面 言 ， 若 v=v,.， 则 du) 
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为 偶数 ， 即 G PRAIA, KARE CM-I. Hv, Ay, 
Mav) 及 dlv,) 均 为 奇数 ，G 中 就 有 两 个 奇数 度 顶点 ， 这 条 欧 拉 路 从 始 于 奇数 度 顶 点 ， 
最 后 也 终止 于 奇数 度 顶 点 。 

充分 性 ， 若 图 G 是 连通 的 ， 且 有 两 个 奇数 度 顶 点 或 全 为 偶数 度 项 点 。 构造 G 的 一 条 
路 径 如 下 : ` 

(1) 若 有 两 个 奇数 度 顶点 ， 则 从 其 中 的 一 个 顶点 开始 构造 一 条 路 径 ， 即 从 "。 出 发 经 
REA e, EA vL. Edo) 为 偶数 ， 则 必 可 由 v, 再 经 关联 边 e, 进入 v,。 如 此 进行 下 
去 ， 每 边 仅 取 一 次 ， 由 于 G 是 连通 的 ， 故 可 到 达 另 一 奇数 度 顶 点 后 停 下 来 ， 得 到 一 条 路 
径 7oelyieayieiik。 洲 G 的 顶点 度数 均 为 偶数 ， 则 从 任 一 顶点 "。 出发， 用 上 述 方 
法 必 可 回 到 顶点 v。， 得 到 一 条 回路 工 ,。 

(2) BL AA TEMS AM. WL BEG HRT, 

{3) HG PRL, JE EBIET Ed G^, NG 中 每 个 顶点 的 度数 为 偶数 。 又 因为 原来 G 
是 连通 的 ， 故 工 , SO 至 少 有 一 个 顶点 Yv, 重合 ， 在 G' 中 从 "出 发 重复 (1) 的 方法 ， 得 
到 闭合 回路 工 ,。 

(4) AL UL, 包含 了 G 的 所 有 边 ， 则 它 就 是 G 的 一 条 欧 拉 回路 (路径) 。 否 则 重 
X (3) 可 以 得 到 回路 工 ,， 由 此 类 推 直到 得 到 一 条 经 过 图 G 所 有 边 的 欧 拉 回路 (路径 ) ， 

对 有 向 图 G(V,E)， 我 们 用 d, Q) 及 d (分 别 表示 顶点 ve V 的 入 度 和 出 度 ， 它 也 
有 一 个 重要 的 基本 性 质 。 
引 理 9.2 (DAHA G(V,E) 存在 一 条 有 商 欧 拉 路 径 ， 当 且 仅 当 存 在 两 个 特殊 的 项 
Rus v, WR: do) 1—d,() d (wad (atl, 而 其 它 所 有 的 项 点 w 
有 af(w)= dutw)， 且 这 条 欧 拉 路 径 始 于 zx RT v, uev, vev, wel. (2) fiit 
GY E SU, BEER va VU LL Qm o fo 
证 明 ”类 似 于 引 理 9.1 的 证 明 。 事 实 上 ， 可 看 作 这 是 对 无 向 图 的 欧 拉 路 径 (回路 ) DUE 
广 。 对 于 有 向 图 的 任意 一 个 顶点 vey 来 讲 ， 若 d.) = dr(?)， 则 该 顶点 的 度数 总 是 偶 


out 


3e Ha O)+ 1-4, ORE d, 9) e 1— 4, (0). ATA ERE, 


9.1.2. RA mC RK 


无 论 是 有 向 图 还 是 无 向 图 ， 这 里 仅 讨论 算法 的 输入 是 一 个 有 向 欧 拉 图 G(V,E),. | 
=n, | 下 = 可。 这 样 做 的 原因 有 两 条 : 其 一 是 对 任何 一 个 输入 的 图 G(Y,E)， 我 们 可 根据 
政 近 图 的 性 质 对 之 进行 检测 ， 以 确定 G 是 否 是 欧 拉 图 ,在 SIMD — CRCW PRAM E, 
车 图 用 邻接 表 形 式 表示 ， 计 算 每 个 顶点 的 度数 无 向 图 ) MAR. HUE (有 向 图 ) ， 只 
需 O(logn) 时 间 、O(n + m) 处 理 器 ; 计算 奇数 度 顶 点 个 数 可 在 O(logn) 时 间 完成 ， 且 只 
T OQ) 处 理 器 ， 检 查 G 的 连通 性 仅 需 O(logn) HR, Of + m) 处 理 器 。 其 二 ， 对 一 个 
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AACR GU, E) RU. CHAT TAR URSIN Ci) 边 ， 使 
GOE) E HEE) E Ho H8, Am BOR UE Ba Q0) - d, Q1 
Bd, (0-4, 人 +1， 则 在 图 中 增加 边 <u>. 计算 出 G* 的 有 向 欧 拉 回 路 后 去 掉 回 路 
上 边 «wc 就 得 出 图 G 的 有 疝 欧 拉 路 径 (ue V, vey) $C, 是 一 个 有 向 回路 或 无 向 回 
路 ， 我 们 用 V(C ,) 表示 回路 C .上 的 顶点 集合 ， 
1， 算法 的 基本 原理 

车 欧 拉 图 G(KV,E) 的 边 集合 被 划分 成 许多 没有 公共 边 的 回 
路 C1，C,，*…，Cl，*…，C(k<m)， 且 每 条 边 eeE 仅 出 现在 唯一 的 一 条 回路 上 ， 但 不 
向 的 回路 可 有 相 河 的 项 点。 这 种 划分 我 们 称 之 为 欧 拉 划分 ,车 对 每 条 边 eeE， 指 定 唯一 的 
一 条 后 继 边 ， 使 得 没有 两 条 边 将 河 一 条 边 作 为 它们 的 后 继 边 ， 则 这 种 欧 拉 划分 是 唯一 确定 
的 划分 . 边 e= «uv 的 后 继 边 SUCC(e) 可 以 是 ， 的 任何 一 条 射出 边 . 显然 e 就 变 
成 SUCC(e) 的 前 趋 边 。 

Atallah 算法 的 基本 思想 是 : 首先 对 一 有 向 欧 拉 图 进行 欧 拉 划 分 ， 设 划分 后 的 回路 集 
A VH{C oC} HR Cac, =o e) BUC, = E. 然后 构造 一 个 由 划分 确定 的 辅 
ll G,(V,, E,) (在 后 面 将 给 出 定义 ) ，G， 是 一 个 无 向 连通 二 分 图 ; 在 G, 上 构造 一 棵 生 
RATS 对 了 的 每 条 边 定义 两 个 方向 ， 结 果 变 为 一 个 有 向 图 交 ， 至 一 定 是 一 个 有 阿 欧 拉 
图 ， 找 出 全 的 欧 拉 回 路 Cs 最 后 利用 C 将 里 的 所 有 回路 缝合 起 来 就 得 到 G 的 有 向 欧 拉 
回路 。 
3989.3 设 T(V,E,), Wien, IEi1=n 一 1 是 任意 一 标 树 。 车 对 每 条 边 定向 ， 使 得 每 
条 无 向 边 变 成 两 条 方向 相反 的 并 行 有 向 边 ， 则 得 到 的 图 全 VV,E;) 是 一 个 有 向 网 拉 图 ， 这 
里 Ei={f<ur>| (veE Tof <v>] OmeE,}. 
证 明 ” 设 树 工 的 任 一 顶点 verv 的 度数 为 do) WET PRA WAR d (0 — do), H 
Ed u= do) Md, =d,_ 0) TEREN, AT ARRERA, MATE 
个 有 向 欧 拉 图 ， 
2. 算法 的 非 形 式 化 描述 


out 


算法 9.1 FINDING DIRECTED EULER CYCLES 
WA: AAG, LE), MAMRADRA, Va fl, 2, oy abi 
输出 : 数组 SUCC(1: m)， 其 中 第 i 条 边 的 后 继 边 SUCC(i+ 1)，(i < m 一) 第 m 条 
边 的 后 继 边 为 SUCC(1) 。 
begin 
(1) 将 图 G(P, 忆 的 边 按 欧 拉 划分 划分 成 许多 无 公共 边 的 回路 集合 
P={C,, Cs, Cl; 
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Q) MuÉHBG(V,E), C-AR STE., XvV,-XxoyY, XA “OHH 
点 ” 集 。 了 是 G 的 顶点 集 即 工 = 了 。 每 一 条 回路 C AG, 的 一 个 加 丫 顶 点 (1 <x 
<k) URGE, X3: 

E, = flu, C) ueV, C, eV, ueV(C ), 1<x<k}; 

(3) RUG KERATU LE), TENTI AERE EC OGRA RR 
ASAT, BRERA RET Ez) 

4 RATARBOS, HUSEUGEA- EDO Ko. HC, cs C AARRE GA 
pag 


end. 


在 进一步 描述 算法 的 实现 细节 之 前 ， 首 先 介绍 Tarjan 等 人 用 树 TO, 已 7) 导出 有 向 
ECV, Eg) 的 欧 拉 回 路 算法 "他 们 将 得 出 的 欧 拉 回 路 用 一 个 合 有 2E | 元 素 的 一 维 数 
组 FOLLOW 存 贮 ， 对 了 中 任意 一 个 顶点 veV,， 设 dl) = d. v 在 了 中 的 4 个 关联 边 分 
WA Qu) ，…， Ge ou, Do eV, i9 0, ns dd. XHE- BUS v 算法 执行 

FOLLOW(«wv,,v»)-FOLLOW(«v»,u, ,,,,2), 0«i&d—1. BH, * 


组 FOLLOW HH T T MRM. Att, ECT AAW. MW FOLLOW 将 
给 出 从 这 条 边 开始 的 一 条 路 径 。 事 实 上 ，FOLLOW Hi T T RA KE. 
下 面 我 们 给 出 在 SIMD 一 CRCW PRAM 计算 模型 上 ， 找 有 向 欧 拉 回路 的 算法 9.1 
中 各 步 的 实现 。 
算法 9.1 的 第 (1) 步 由 两 个 子 步 组 成 . 
Step1.1 对 所 有 边 <i,j> eE 按 字典 次 序 定 序 。 任 意 两 条 边 < ab > 和 < c,d>， 
«ab 的 字典 序 先 于 < c,d > 4BR4a<cRMa-cHb<d. 4 OUT. EDGE(v,k) 
是 顶点 vr 的 第 条 射出 边 (1 <k ed (). 对 <i,j> eE MPR, Be 
<j,i> HT. 令 IN_EDGE(v,k) 是 顶点 ， R78 k RAM (Ik « d, ()). 
Stepl.2 for cach v, k: (1& v &n) and (1&k <d (v) pardo 
SUCC(N. EDGE(y, £)- OUT... EDGE(, k) ; 
NEXT(IN__EDGE(y, k)) - OUT... EDGE(, k) 
endfor ; 
step1.1 可 应 用 Cole 的 排序 算法 来 实现 ， 需 O(logm) 时 间 、0O(m) 处 理 器 9; Step1.2 将 G 
的 边 集 合 划分 成 许多 没有 公共 边 的 回路 。 数 组 SUCC 和 辅助 数组 NEXT 对 G 的 每 条 边 
定义 唯一 的 一 条 后 继 边 。 最 终 的 目标 将 使 数组 SUCC 含有 欧 拉 回路 。 辅 助 数组 NEXT 是 
数组 SUCC 的 一 个 拷贝 ， 在 后 面 计算 中 要 用 到 它 ，Step1.2 R8 OMHE. Om) AERE 
器 ; 所 以 ， 第 0) 4288 O(logm) HTT. O(n) 处 理 器 . 
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算法 9.1 的 第 (2) 步 由 Step2.1 及 Step2.2 组 成 ， 
Step2.1 ”将 每 条 回路 C 上 字典 序 最 小 的 边 选 作 回 路 在 辅 图 G, 上 的 回路 顶点 ， 它 代表 回 
路 C， 为 此 ， 用 一 维 数 组 D 来 标识 边 所 在 的 回路 . 对 任 一 边 LI» eE，D(<i,j> ) 初 
始 化 时 为 < i,j> . 最 终 D(<ij> ) 等 于 边 <i,j> 所 在 回路 上 最 小 字典 序 的 边 ， 即 具有 
HA D 值 的 所 有 边 位 于 同一 回 上 路上， 具体 实现 是 : 


for k«-1 to [logm do 
for each e= <u,v>:e EE pardo 
D(e) — min(D(e), D(NEXT(e)}; 
NEXT(e) — NEXT(NEXT(e)) 
endfor 


endfor ; 


Ed e WE D(e) — e, Me 是 它 所 在 回路 的 标识 . 
Step2.2 ”构造 一 个 辅 图 G (V E) G, 是 一 个 无 向 二 分 图 ， 其 中 P = frl ver ER 
由 SUCC 定义 的 一 条 回路 h E, = f(,CO] C, PARMA, C, ev, veV(C,)}. UR: 
一 个 顶点 ”可 能 在 一 条 回路 C, 上 出 现 多 次 ， 每 次 出 现时 ，" 是 通过 < py > eE 的 边 进入 
的 . 4 CERTIFICATE((»,C ,)) AIBC, 上 一 条 形式 为 < i,v eE 的 边 。 
Step2.1 只 需 ogm! 次 循环 就 足够 了 ，、 因 为 一 条 回路 最 多 只 有 O(n) 条 边 ， 故 这 一 子 步 
fF O(logm) BEI). O(m) 处 理 器 ; Step2.2 可 应 用 排序 算法 产生 图 G ,和 选择 
H CERTIFICATE((,C y), (,C )eE,. BG, 的 顶点 数 至 多 为 O(n + m)， 边 数 至 多 
X O(n m)， 所 以 这 一 子 步 需 0{logn) HERI. O(n + m) 处 理 器 。 因 而 整个 第 (2) 25 
上 O(logm) 时 间 、O(n + m) 处 理 器 - 

算法 9.1 的 第 (3) 步 由 Step3.1 和 Step3.2 组 成 . 
Step3.1 WG, 的 生成 桂 T=(V pE, 
Step3.2 将 树 了 的 每 条 边 e= (v, nek, 替换 成 方向 相反 的 一 对 并 行 边 <w,»> 及 
< ww > ， 从 而 构成 有 向 欧 拉 图 F(V,, EF) 


Step3.1 应 用 Shiloach 等 人 在 SIMD — CRCW PRAM 模型 上 的 求 连通 分 支 算 法 中 ， 这 一 
子 步 需 O(logm) Hii]. O(n + m) 处 理 器 。 Step3.2 在 使 用 O(n +m) 个 处 理 器 情况 下 ， 仅 
需 O (D) 时 间 就 可 完成 ， 故 第 (3) 步 需 O(logm) R, O + m) 处 理 器 ， 

算法 9.1 的 第 (4) 步 亦 由 两 个 子 步 组 成 . 

Step4.1 的 目标 是 将 数组 SUCC 变 成 更 大 的 回路 ， 使 得 回路 上 的 边 是 G 及 了 的 边 交 
替 出 现 。 且 回路 上 的 边 要 满足 两 条 人 性质 :其 一 ， 宁 的 边 在 回路 上 出 现 的 次 序 同 它 在 了 的 欧 
拉 回 路 上 测 现 的 次 序 一 致 ; 其 二 ，G 的 边 在 问 路 上 出 现 的 次 序 同 它 在 G 的 欧 拉 回 路 出 现 
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KER. AERO AER BABE, MARE KREE R ABER 
路 。 为 了 便于 计算 ， 我 们 引入 一 个 更 大 的 数组 SUCC1， 存 贮 由 G 及 了 边 交替 组 成 的 回 
路 . 初始 化 时 ， 对 任意 一 条 边 eeE， 做 : SUCCI(e)<- SUCC(e) 
对 顶点 veV， 且 veV， 设 在 树 T 中 4(v)=4d,v 的 d 条 关联 边 分 别 
为 (vw)，…，{vus_1)， 那 么 在 回路 中 v 的 后 继 者 由 
SUCCI( < u v>) -SUCC <V no, vos>) OSigad-1 
BGEXHSAR EEUU C,e'Y AC eV, 4 C, 在 了 中 度数 d(C,)= 4q， 它 的 了 4 条 关联 边 
Hv)» nmm, V C). HR: vV, 0x«i«d—1. 4 CERTIFICATE((y,,C,)) 
是 <i, > O<acd—1, X d RERA (Certificate Edge) 都 是 G 的 边 ， 它 们 将 按 
一 定 的 次 序 出 现在 回路 C, b. 这 一 子 步 的 基本 思想 是 : 从 边 eeE 在 C, 上 的 次 序 可 获 
得 e 在 了 的 回路 上 的 次 序 ， 注 意 在 算法 9.1 第 Q0) 步 中 .已 有 
SUCC(<i, 7 >= <1, j, 7, 0&a&d— 1, 
ERER. ÆC, E <vo h> Riv > 的 后 继 边 。 
step4.1 for each e: {e = (v „C JeE,)A(Q<a<d—1) pardo 
e, *- CERTIFICATR((v,,C ,)); 
SUCCI < V,, C, > )e SUCC{e,); 
SUCCI (e) «C, v,» 


E 


endfor ; 


下 面 证 明 : 完成 Step4.1 后 ， 性 质 二 必然 成 立 。 
5189.4 ”算法 9.1 的 第 4.1 步 结束 时 ，SUCCI1 含有 G 的 一 条 欧 拉 回路 . 
HB 设 <ij> eE， 我 们 证 明 它 在 由 SUCC1 定义 的 回路 上 。 算法 在 执行 了 第 (1) 步 
B «Lj» 在 某 条 回路 C, 上 (1<x<k). HEG 的 生成 树 中 ， 回 路 顶点 C, KER 
Ad, WHE C, 含有 d 条 证 实 边 将 C， 划分 成 4 条 路 径 : 每 条 路 径 开始 于 证 实 边 的 后 继 
边 ， 终 止 于 下 一 条 证 实 边 ，< i,j > 必须 位 于 某 一 条 路 径 上 ， 而 每 条 证 实 边 必须 
Æ SUCCI 定义 的 回路 上 。 因 此 «ij» 必 位 于 SUCO 定义 的 回路 上 ， 而且 第 二 次 出 现 
这 条 路 径 时 必须 在 遍历 了 G 的 所 有 其 它 边 之 后 ， 否 则 根据 性 质 一 ， 与 SUCC1 定义 相 矛 
JB. 
Step4.2 for cach e: eeEOE, pardo 
if SUCCI (e)eE, then SUCCI(e) - SUCCI(SUCCI(e)) endif 
endfor ; 
for cach e:ec E pardo 
SUCC(e) - SUCCI(e) 
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endfor ; 


Step4.1 需 O(I) 时 间 、O(n + m) 处 理 器 ; Step4.2 是 从 SUCC 定义 的 回路 上 消除 辅 图 G, 
后 导出 的 哆 拉 图 了 的 边 。 由 Step4.1 可 知 ， 不 存在 两 条 同属 于 他 的 边 作为 前 趋 和 后 继 ， 
故 Step4.2 也 只 需 D(1) 时 间 、O(n + m) 处 理 器 . 因此， 整个 第 (4) HG OC) 时 
fi, Oln + m) 处 理 器 。 
定理 9.1 在 SIMD 一 CRCW PRAM Ł, R-AK G(V,£), |V| 9n. |El=m 
的 欧 拉 回路 ， 算 法 9.1 8$ O(logn) AYIA), O(n + m) 处 理 器 . 
证 明 ”通过 上 面 对 算 法 各 步 的 分 析 ， 容 易 看 出 。 

对 于 找 无 向 图 GUE) 的 欧 拉 回路 ， 我 们 可 采用 类 似 的 方法 。 也 就 是 将 G(V,E) 的 六 
给 予定 向 ， 使 之 成 为 一 个 有 向 图 ， 然 后 利用 有 向 图 的 求 欧 拉 回路 算法 求 出 G HORE 
路 〈 抹 去 边 的 方向 ) 。 

4 G(V,E) 是 一 个 无 向 图 ， 而 且 是 一 个 欧 拉 图 。 令 G 是 将 G 的 每 条 边 (u,v)eE 定向 
为 方向 相反 的 两 条 有 向 并 行 边 uy» 及 <vu> 后 的 有 向 图 。 在 G 中 究竟 其 条 有 向 边 
中 的 哪 一 条 将 代表 G 中 相应 的 边 呢 ?现在 来 研究 它 。 令 vev 的 度数 为 4。 因 G 是 欧 拉 
图 ， 故 4 为 偶数 . Sv, ue Que o> Qs up 是 ， 的 关联 边 . 按 下 述 方式 对 有 向 
图 G 进行 欧 拉 刘 分 。 对 每 个 奇数 二 1 < i<d 做 : 


NEXT(<u,, y2)— «v, u,,7; 


NEXT(«u,,, »»)— «v u, >; 

将 数组 NEXT 定义 的 许多 无 公共 边 的 回路 成 对 地 进行 划分 。 对 每 条 回路 C 。 来 讲 ， 存 在 
SHB LBC’, Cl 是 由 C 的 所 有 相反 方向 的 边 组 成 的 。 我 们 的 目标 是 从 G 的 每 对 
回路 中 删除 其 中 的 一 条 回路 ， 最 后 每 对 方向 相反 的 边 只 剩 下 一 条 ， 这 条 有 向 边 就 代表 G 
的 对 应 边 。 

对 有 向 图 G' 的 每 条 边 e = < i,7> ， 计 算 它 所 在 回路 上 字典 序 最 小 的 边 Dle R 
后 ， 对 G 的 每 条 边 e = (uve E HUE, Æ D( < u,v > ) 的 字典 序号 小 于 D( < va > ) 的 字 
REG, MEA < wa > AG PME. 由 于 G 满足 引 理 9.1， 因 而 从 C 中 删除 一 些 边 
后 的 有 向 图 G^ 满足 引 理 9.2， 又 因为 G 是 欧 拉 图 .所 以 G 是 有 向 欧 拉 图 。 对 G” 执行 找 
有 向 欧 拉 回路 算法 后 就 可 得 到 G 的 一 个 欧 拉 回 路 〈 抹 去 有 疝 边 的 方向 ) . 
推论 9.1 在 SIMD 一 CRCW PRAM k, cR —/- GU G(V,E), |V| o n. (E= m 的 欧 
拉 回 路 ， 需 0{logn) 时 间 、O(n + m) 处 理 器 ， 
证 明 ”由 无 向 图 G 定向 成 为 一 个 有 向 图 G EOMME, Om) 处 理 器 ; 对 G^ 实行 欧 拉 
划分 需 OU) 时 间 、O(m) 处 理 器 ; 计算 每 条 回路 的 字 虚 序 最 小 边 ， 由 找 有 向 欧 拉 问 路 算 
法 9.1 的 第 (2.1) 步 知 ， 需 O(logm) 时 间 、O(m) 处 理 器 ! 由 G 导出 G” 需 0(1) 时 
E. Om) 处 理 器 ;由 定理 9.1， 求 G” 的 有 向 欧 拉 回路 需 O(logm) HERI. O(n + m) 处 理 
器 ; 又 因为 G* 的 欧 拉 回 路 也 就 是 G 的 欧 拉 回路 .所 以 找 一 个 无 向 欧 拉 图 的 欧 拉 回 路 ， 
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需 O(logm) H. O(n +m) 处 理 器 ， 

推论 9.2 ”在 SIMD—EREW PRAM b. 求 一 个 有 向 (无 向 ) 的 欧 拉 图 的 胸 拉 回路 ， 
需 O(og*n) BYTE], O(n + m) 处 理 器 ， 这 里 是 图 的 顶点 数目 ，m 是 图 的 边 数 。 

证 明 ” 返 用 不 同 计算 模型 之 间 的 通用 模拟 技术 "”"， 算 法 9.1 在 SIMD - EREW PRAM 
上 实现 ， 需 0 (log*n) H. Of + m) 处 理 器 。 


92 在 竞赛 图 中 找 哈密 顿 回路 算法 


一 个 竞赛 图 (Tournament Graph) 是 一 个 有 向 图 G(V,E)， 对 VV 中 每 一 对 顶点 4 
My, RH <u,r > eE， 或 者 < wa > e， 但 这 两 条 边 不 能 都 在 中， 竞赛 图 G(V,E) 
是 从 个 选手 竞赛 的 模型 抽象 出 来 的 ， 每 个 选手 必须 间 其 它 所 有 选手 都 有 一 场 竞赛 ， 竞 赛 
规则 是 每 场 必 有 输赢 而 不 能 出 现 平局 。 竞赛 图 一 个 有 用 的 性 质 是 : 每 个 竞赛 图 导出 的 子 图 
也 是 一 个 竞赛 图 、 若 uv eE， 我 们 说 & 支配 "， 将 这 种 性 质 定 义 为 x > ?。 由 于 图 中 
边 的 方向 可 以 是 任意 的 ， 故 支配 关系 并 不 一 定 是 传递 的 。 将 上 述 的 支配 关系 推广 到 顶点 集 
Bk, SASV, Bc V, XXHES UU ve4， 对 另外 任意 一 个 顶点 veB, WAY 
>u, WHE 4 支配 集合 B ( 记 作 4 >B) S5.408-4. BEI ^ UR vey, R 
们 对 其 它 顶 点 按照 网 v 的 关系 分 为 两 大 类 : WO) Be 支配 的 顶点 集合 〈 在 比赛 中 ， 
赢 ) ， 即 对 任意 一 个 we W(v) 内 均 有 v >u. L(Y) 是 支配 v 的 顶点 集 《在 比赛 中 输 ) ， 
即 对 任意 一 个 we 上 (v) HE u > ?。 本 节 使 用 的 其 它 一 些 记号 是 : 对 一 个 顶点 集合 U 
& V. G(U) 是 指 在 U 上 导出 的 子 图 .对 一 个 图 G， 用 vio). E(G) 分 别 代表 G 的 顶点 集 
合 及 边 集 合 。 对 两 个 图 A, B, HAUB 表示 这 两 个 图 合并 为 一 个 图 。 对 两 条 路 
径 P，Q， 用 了。 表示 它们 连接 起 来 变 成 一 条 更 长 的 路 径 ， 


9.2.1 竞赛 图 的 一 些 基本 性 质 


竞赛 图 G(V,E) 有 许多 重要 的 人 性质。 本 节 具 给 出 与 介绍 的 算法 有 密切 联系 的 几 个 基 
FEM. 
引 理 9.5 ”每 个 竞赛 图 G(V，E) ERU — RRE. 
证 明 ”对 竞赛 图 的 顶点 数目 n THAER. Yn = 2 时 ， 命 题 品 然 成 立 ， 假 定 对 个 顶 
点 的 竞赛 图 ， 命 题 成 立 。 现 在 考 虞 一 个 具有 # 十 1 个 顶点 的 竞赛 图 G(V,E)。 对 任意 一 个 顶 
点 veV，G 的 导出 子 图 G(7 — (v1) 也 是 一 个 竞赛 图 ， 由 归纳 假定 可 知 ，G(Y — fv) 中 存 
在 一 条 哈密 顿 路 径 。 这 条 路 径 的 顶点 序列 为 vr，…，?，， 其 中 站 ep 一 和 
=1, =, n, By >u, Bay, vp vus e v, 这 个 顶点 序列 构成 G 的 一 条 哈密 顿 路 
f. 否则 令 i 是 序列 中 满足 y，> ， 的 最 大 下 标 。 若 1= za， 那 么 项 点 序 
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Dv va mo v, v BUR G OR. Bie, AE 
eor, 是 G 的 一 条 哈密 顿 路 径 。 故 在 有 n+ 1 个 顶点 的 之 


到 yy y. tm Vp vus 
赛 图 中 也 存在 一 条 哈密 顿 路 径 ， 

不 难看 到 ， 上 面 的 证 明 事 实 上 给 出 了 一 个 找 G 的 哈密 顿 路 径 的 有 效 算法 但 这 个 算 
法 本 质 上 是 顺序 执行 的 。 为 了 得 到 找 G 的 哈密 顿 路 径 的 并 行 算法 ， 我 们 需 采 用 不 同 的 方 
法 .下面 将 介绍 用 分 而 治之 策略 设计 的 一 个 并 行 算法 ”。 

一 种 最 简单 的 办 法 是 ，(1) 把 竞赛 图 分 发 成 顶点 数 相等 的 两 个 子 图 G， 和 G,; (2) 并 
行 地 找 出 6, MAE WG, HH: GHH, 与 万 , 连接 起 来 形成 8 的 一 条 哈 
密 顿 路 径 H+ 五 ,。 但 这 一 步 尚 不 能 保证 正确 地 找到 G 的 一 条 哈密 顿 路 径 ， 因 为 对 A, 
RH, 两 头 的 端点 无 法 控制 

因此 ， 为 找 出 G 的 哈密 顿 路 径 ， 必 须 对 上 述 简 单 的 方法 进行 适当 的 修改 ,这 里 的 关 
键 在 于 对 G 中 顶点 的 观察 令 "er， 设 由 工 (?) 导出 的 子 图 GOL) 的 哈密 顿 路 径 
Adm du. HeL(Q) Ixixk. BW) 导出 子 图 G(W(Y)) 的 哈密 顿 路 径 
为 wi wp =s Wo w EWO) 1&j&s. Atl, Hv. MHEG 网 一 条 险 
密 顿 路 径 D. lp onn hy. wp wp us w. 注意 ， 这 等 于 给 引 理 9.5 提供 了 另 一 个 
WH. 

根据 这 种 思想 ， 下 面 给 出 找 竞赛 图 的 哈密 顿 路 径 的 并 行 算法 。 在 此 之 前 ， 我 们 给 出 
一 个 引 理 将 对 怎样 选择 顶点 v 起 指导 作用 . 
引 理 9.6 ”在 一 个 竞赛 图 G(V,E) P, REV =”。 存 在 这 样 一 个 顶点 vs 上 ，， 的 集 
合 工 (7) 及 集合 WO) 分 别 至 少 含有 La / 41 个 顶点 ， 
证 明 SIN={u | dy) d (uw), weV}, OUT - V — INE MN OUTIL. BBR 
原理 ， 在 IN 中 存在 一 个 顶点 v， 它 在 GUN) 中 出 度 不 小 于 它 的 入 度 ， 即 

dW) PUIN/2) z1n/4] Hd,()m d, ()min/4l ; 
OUTI SUNI, RTH 0U 了 集合 内 取 一 个 顶点 vy， 其 余 证 明 与 上 面 类 似 ， 

由 引 理 9.6， 我 们 得 到 一 个 求 竞赛 图 的 哈密 顿 路 径 算法 。 


算法 9.2 FINDING HAMILTON PATH IN TOURNAMENT 
输入 : 竞赛 图 G(V,E); 
输出 : .哈密 顿 路 径 了 Path， 
procedure H_ path(G, |V1) ; 
begin 
(0 nael; 
(2) if n= 1 then return the unique vertex of G endif; 
(3) find a vertex ve V whose in degree and out degree in G are 
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both at least La/ 4) ; 
(4) in parallel find H, —H. Path(G(L(v), |L(v)); 
H,-H..Path(G(W(v5, IWQ)D ; 
(S) return the path (H, + v) H,) 


end. 


定理 9.2 在 SIMD — EREW PRAM 上 ， 计 算 一 个 竞赛 图 G(V,E), || =n 的 哈密 顿 路 
径 , 算法 9.2 需 O(log n) BHA. O(n” / logn) 处 理 器 。 

证 明 ”由 引 理 9.6 可 知 ， 算 法 9.2 的 第 (4) 步 需 执行 O(logn) 次 递归 调用 .每 次 调用 时 ， 
算法 的 第 (3) 步 在 最 坏 情况 下 ， 若 采用 处 理 器 分 组 技术 ， 在 使 用 O(n^ / logn) 处 理 器 时 ， 
可 在 Ologn) 时 间 内 完成 。 故 整个 算法 过 程 需 (log n) BLM. O(n? / logn) 处 理 器 . 


9.2.2 算法 的 基本 原理 


首先 我 们 引入 受 限 的 哈密 顿 路 径 (Restricted Hamiltonian Path) 概念 。 一 条 哈密 顿 
路 径 是 受 限 的 哈密 顿 路 径 ， 若 它 的 其 中 一 个 端点 是 指定 的 { 注意 ， 只 有 一 个 端点 指定 ， 而 
不 是 两 个 端点 都 指定 。) 。 设 G{V,E) 是 一 个 竞赛 图 ，*e 世 是 这 样 的 一 个 端点 ， 若 从 ， UH 
发 到 所 有 顶点 都 存在 一 条 有 向 路 径 ， 则 称 "为 源 点 ; 若 所 有 其 它 顶 点 都 存在 一 条 有 向 路 径 
可 达 v. MPR y 为 终点 ， 
定理 9.3 ”在 一 个 竞赛 图 G(V,E) 中， 如果， 是 G 的 源 点 (终点 ) ， 那 么 G 有 一 条 从 v 开 
dá GELT v) 的 哈密 顿 路 径 。 
证 明 ”我 们 仅 证 明 ve V 是 源 点 的 情形 ,事实 上 ， 当 v 是 终点 时 ， 其 证 明 是 对 称 的 。 现 在 
用 归纳 法 对 n 施加 证 明 。 当 n— 1 时， 命题 显然 成 立 。 假定 对 半 个 顶点 的 竞赛 图 ， 命 题 成 
3L. 现 考虑 一 个 具有 + d 顶点 的 竞赛 图 G(V,E)， 令 v 是 G 的 源 点 。 运 用 时 纳 新 言 ， 我 
ARRE GOV (v)) 含有 GU — 和 的 一 个 源 点 。 根 据 引 理 9.5, GOV(v)) 含有 一 条 哈密 
顿 路 径 。 比 如 说 这 条 路 径 始 于 uw Wu 就 是 GOW) 的 源 点 。 此 外 ， 根 据 妇 纳 假设 ，WY(v) 
中 的 一 些 硕 点 可 达 Lo) 的 每 个 顶点 ， 这 样 x 是 G(v — Dp 的 源 点 . 
引 理 9.7 设 G(V,E) 是 一 个 竞赛 图 ，C,,.C,，…，C, 是 G MRAM, MAM 
fC, RC, RU, SE C, FC, MAC, > CUAD 1 Stick. 
证 明 ”根据 强 连通 分 支 定 义 ， 连 接 C, 与 C ,之 疗 的 所 有 有 向 边 方向 是 一 臻 的 ， 因 为 G 荐 
一 个 竞赛 图 ， 这 些 边 是 存在 的 。 
引 理 9.8. WE G(V,E) EDERE, Co Co nn C, 是 它 的 强 连 道 分 支 ， 根 据 集合 问 
的 支配 关系 ”> “， 一 定 存在 一 个 有 序 序列 C，，……，C， 使 得 : 

C, AC, AC, ara, , Ó«i,xk, I< ick 
证 明 ”由 引 理 97 可 知 ， 对 任意 三 个 强 连通 分 支 C, Cu. C,. PEC FC, 
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C,>C, WC, > Ci 我们 采用 反 证 明 法 证 明 : BC, > C,， 如 图 9.1 所 示 ， 风 从 


91 BC, AC, C, 2C, (AC, > Ci 情形 

i, RRAK; Hh Ein. BMA, 经 7, 到达 1,， 再 由 i 回 到 二， 形成 一 条 加 路 
显然 这 条 回路 上 从 任 一 顶点 到 所 有 其 它 顶点 都 是 可 达 的 ， 也 就 是 说 ，C,，C ,及 C, 上 的 
一 些 顶点 也 组 成 了 一 个 强 连 通 分 支 ， 这 与 C,，C 及 C 是 三 个 不 同 的 强 连 通 分 支 矛 盾 。 
所 以 必 有 C, > C,， 由 此 类 推 ， 最 终 可 以 得 出 C， >C, >C 2 AC, . 

根据 上 述 两 个 引 理 ， 我 们 可 给 出 定理 9.3 的 另外 一 个 证 明 . wC Cr, C, 
是 G 的 强 连 通 分 支 且 有 C, >C, >C, > > C,. 由于， 是 G 的 源 点 ， 它 必须 位 
于 C, 上 , AC, 是 强 连 通 的 ， 它 含有 一 条 哈密 顿 回 路 H, OH, 是 将 H, PEA v i 
那 条 边 删 去 后 的 哈 审 顿 路 径 . WEE: H, 是 C，, 的 一 条 始 于 v 的 哈密 顿 路 径 . $H, 
是 和 C,，C，,，"…，C.} 的 哈密 顿 路 径 。 通过 上 述 的 构造 ， 五 , 的 最 后 一 个 顶点 将 支配 H, 
的 第 一 个 顶点 ， 这 样 HT, H, 是 G 的 一 条 从 v 开始 的 哈密 顿 路 径 
定理 9.4” 设 竞赛 图 GV EL) 是 一 个 强 连 通 图 ， 那 么 存在 一 条 哈密 顿 回 路 。 
WH ” 设 G 是 一 个 强 连 通 竞赛 图 ， 令 "er， 且 工 ， >L, >L, > >L, BELO) 
强 连通 分 支 ， LW, >W, >m >W, >W, EGO) 的 强 连通 分 支 由 于 G 是 
强 连 通 的 ， 故 必 存 在 某 条 边 离开 W, 每 条 这 样 的 边 必 指 商 LO) 的 一 个 点 ， 根 据 定义 ， 
它 不 可 能 指向 W, IUS i 1 或 者 指向 vy. 4 m'-— minit | a > 5 对 某 个 aeV(W,), 5 
eV, RRS w, eV) er) Bw, > 五。 对称 地 ， 必 存在 一 条 指向 工 ; 顶点 
的 边 . 令 

k=minfila > 5 对 某 些 aeV(W,), beV(L)}, weV(W,), LEVL D Bw, 
ah. 


2 


为 了 证 明 图 G 的 哈密 顿 回路 的 存在 性 ， 可 以 将 图 9.2 所 示 的 几 条 路 径 和 它们 的 端点 连 
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为 了 证 明 图 G 的 哈密 顿 回路 的 存在 性 ， 可 以 将 图 9.2 所 示 的 几 条 路 径 和 它们 的 端点 连 
接 起 来 ， 这 样 就 构造 性 地 证 明了 存在 一 条 哈密 顿 回路 ， 这 几 条 路 径 分 别 为 : 


LO» 


Wo) 


图 9.2 定理 94 WREE BRATA REA HIA EMPIRE, RR. 
(1) G(V(W 1)) 的 一 条 终止 于 w , PETRI EPOR 


(2 


GU VUL DARTI MAKRA E 
(3) Le 

(D GU PCW S AREE LET AB 
(56) GOL IS — R1, fon EUR 

(6 aU Vw Ju U VQ. AREE. 


我 们 断言 上 述 的 路 径 按 (1), (2), G) 4) 6) (O 次 序 连接 起 来 后 ， 就 形成 了 G 的 
一 条 哈密 顿 回路 。 实际 上 ， 上 述 的 路 径 确实 都 存在 ， 受 限 路 径 (D. (2) (0 和 (5) 是 定 
389.4 的 结论 ， 我 们 仅 需 验证 的 事实 是 : 连接 每 条 路 径 端点 之 间 的 有 向 边 ， 其 方向 是 所 其 
望 的 方向 唯一 不 明显 的 情况 是 ， 从 路 径 (5) 到 路 径 (6) 之 间 的 连接 以 及 从 路 径 (6) 到 路 
fü) 之 闻 的 连接 。 为 证 明 这 一 点 , 我 们 还 记得 , 按 某 种 方式 选取 工 v 及 路 k 
BEAL, Lp os Lya BEW, EW, Wyo WL, RE. A 
此 路 径 (5) 的 最 后 一 个 标点 必须 支配 路 径 (6) 的 第 一 个 顶点 。 类似 地 ， 路 径 (6) 的 最 后 一 个 
顶点 必须 支配 路 径 (1) 的 第 一 个 顶点 。 注 意 路 径 (6) 的 两 个 端点 可 能 在 L(Y) 中 ， 也 可 能 
£ wv) 中 . 
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定理 9.4 的 证 明 实 际 上 给 出 了 一 个 找 强 连 通 竞 赛 图 的 哈密 顿 回路 的 算法 ， 这 个 算法 首 
先 选 择 一 个 “平庸 ”(Medioere) 的 顶点 ve VY， 将 一 个 问题 划分 为 几 个 子 问题 ， 子 
图 (1D)，(2)，(3)，(4) 及 (5)， 每 个 至 多 含 34 74 个 项 点， 然而 由 强 连 分 
RWW, RL, Lo, 合并 的 子 图 (6) 可 能 非常 大 ， 甚 至 它 包含 


Bev. wi. wp DL 这 些 顶点 之 外 的 所 有 项 点， 这 是 因为 wo wo Lo 1, 保证 在 
这 个 子 图 的 外 边 。 图 (6) 非常 大 的 困难 事实 上 没有 关系 ， 问 题 的 关键 是 : 在 (6) PERK 
哈密 顿 路 么 是 不 受 限 制 的 ， 因 此 我 们 可 以 利用 算法 9.2 寻找 这 条 哈密 顿 路 径 ， 且 不 必 为 这 
个 子 问 题 的 规模 而 烦恼 ， 因 而 在 ”个 顶点 的 况 赛 图 上 寻找 哈密 李 回 路 或 受 限 的 哈密 顿 路 径 
可 以 分 成 几 个 类 似 的 子 问题 ， 它 们 每 个 都 不 超过 3n / 4 个 顶点 ， 

在 叙述 算法 之 前 ， 我 们 给 出 怎样 计算 竞赛 图 的 强 连 通 分 支 ， 对 一 个 一 般 的 有 向 图 ， 计 
算 其 强 连通 分 支 的 方法 是 传递 闲 包 法 ， 在 SIMD — CREW PRAM E. f£ Olog n) ftl 
HH. OG?) 处 理 器 .但 是 ， 从 顶点 的 度数 出 发 ， 计 算 竞 赛 图 的 强 连 通 分 支 有 一 个 更 简单 有 
效 的 方法 ， 

首先 定义 顶点 ve 的 得 分 s(v) (Score), Ev 所 支配 的 顶点 个 数 ， 一 个 竞赛 图 的 得 
分 序列 是 它 所 有 项 点 得 分 的 一 个 列表 、 


{Wa Wa Wa ras b. a 


图 9.3 定理 9.4 描 述 的 哈密 顿 回路 ——— 
988899 GVE A EXER. Su, veV HsQ) s(v). $ 5, RS, THES 
有 ww 及 v， 的 强 连通 分 支 ， 那么 或 者 S, =S, RES S. 
证 明 ”车 4 > v， 则 命题 显然 成 立 ， 若 > wu， 则 根据 馈 集 原理 ， 必 存在 一 个 顶点 w. 


diu > w Hw > y， 因 而 命题 在 这 种 情况 下 也 成 立 . 
BV ate. oy vul XB s) «so, € «s(,). 定理 9.4 告 诉 我 们 : HR 
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个 do MEARE ADSI SEW vs vyp m gs Be PRS NS XK 
始点 及 终点 呢 ? 方法 很 简单 。 如 果 "， 是 一 个 强 连 通 分 支 中 最 高 得 分 项 点 ,那么 


My, & v Sk <a Eso) =C Hob Y sy) ERRERA frp ens v LIBRE 


BEADRA: C? 是 在 这 个 顶点 集 上 导出 的 竞赛 图 边 的 数目 ， 反 之 也 成 立 . Lol) 


>Ci, W», H v,,, 在 同一 强 连 通 分 支 中 .。 因此， 图 G 的 强 连通 分 支 计算 如 下 : 首先 对 
每 个 顶点 v 计算 s(v)， 并 按 非 降 序 对 s(y,)，-…，s(y,) 进行 排序 ， 使 得 s(v,) «sv «cn 


<s(v,)) 然后 计算 部 分 和 P -Ysv)-Cl.l«k«m 最 后 根据 序 
Bp, ms Boos p, 中 的 堆 来 划分 强 连通 分 支 。 


9.2.3 ”算法 的 形式 化 描述 


算法 9.3 HAMILTON CYCLES ALGORITHM 
proedure Restricted. Path (G, endpoint, u); 
begin 
(1) let n is number of vertex of G ; 
(2) if n=1 then return the unique vertex of G endif; 
(3) find strongly connected componets C, >C, 2,;-. >C, of G; 
(4) if endpoint — "start" then 
(4.1) in parallel find H, - CYCLE(C,) 


‘ à 
H,—H- Path (Uc, IU VQ); 


(4.2) H,<—H, — funique directed edge into u} 
endif ; 
(5) if endpoint — end then & 
t-i koa 


(5.1) in parelel find H,- H.. Path(U C,, IU V(C,D; 


H, —CYCLE(C,); 
(52) H,- H, — (unique directed edge and of u} 


endif ; 
(6) returm the path H DH, 


end; 
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procedure CYCLE(G) ; /* EXER / 

begin 

(1) let n is number of vertex of G ; 

(2) if n—1 then return the unique vertex of G endif; 

(3) find a vertex, veV(G), whose in_degree and out degree in G are both 
at least Ln / 41 ; 


(4) find strongly connected components L, 2L, aL, of G(L(v)) and 
W,2W, > >W, of G(W(»); 

(5) in parallel find 
m'  min(i | a 25 for some aeV(W,), beV(L,)}; 
k«- min(i | a 25 for some aeV(W ), beV(L; 
the results are wieV(W,), LEVL wh w,EV(W ph fev(L,), 
and w, 21,, w,21,; 

(6) in parallel find 
H +- Restricted. Path(W,, "end", w,); 


H, c Restricted_Path(\JZ,, "start", 1,); 
m 


, 
H, — Restricted. Path(U W,, "end", w,); 


int 
H , — Restricted... Path(L ,, "start", /,); 
1 w-i 


ke ow m 
H,-H Path(UW,o Ur, | UKW D+ U vas 


i=? pe i=2 a 


0) return the cycle y + H,* H,* HL Hu Hv 


end. 


9.2.4 算法 的 复杂 性 分 析 
在 给 出 算法 的 复杂 性 之 前 ， 我 们 首先 给 出 计算 竞赛 图 的 强 连通 分 支 的 复杂 性 . 

引 理 9.10 在 SIMD — EREW PRAM 上 ， 求 一 竞赛 图 G(V,E). IV| =n， 的 所 有 强 连 遂 
A W Ollogn) HP. O(n” / logn) 处 理 器 。 
证 明 首先， 计算 每 个 顶点 veV E882) s0) 98 O(logn) HT. O(n” /logn) 处 理 器 ， 对 
竞赛 图 得 分 序列 进行 排序 ， 需 O(logn) iis]. O(n) 处 理 器 由， 然后 ， 对 得 分 序列 计算 部 分 
AL, MÆ O(logn) 时 间 内 使 用 O(n /logn) LMR SER. HOR G 的 强 连通 分 支 
$ O(logn) NIE]. O(n? / logn) 处 理 器 ， 
定理 9.5 在 SIMD — EREW PRAM 上 ， 找 一 竞赛 图 G(V,E), |V| =n ZRA e LR 
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径 或 哈密 顿 回路 ， 需 O(log n) ITT, O(n” / logn) 处 理 器 。 
证 明 ” 找 一 竞赛 图 的 受 限 哈密 顿 路 径 或 哈密 顿 回路 ， 是 由 过 程 Restricted. Path 及 过 
程 CYCLE 相互 调用 获得 的 。 因 每 次 v 的 选择 使 其 人 度 和 出 度 均 大 于 等 于 Ln / 41 ， 故 得 
到 子 问题 的 最 大 规模 为 [3 / 41 ， 所 以 两 个 过 程 相互 调用 要 进行 O(logn) 次 ， 而 由 定 
38 9.2 SUB dE n PARERE O(log n) HB. O(n” /logn) 处 理 器 ; 所 以 算法 
的 计算 时 间 T(n) 为 : 

24,34 


dog close 
TQ) =e Y, log (G) n= cY (klog? + logi)! = O(log'n) 


其 中 ce，c' 为 大 于 零 的 常数 。 处 理 器 数 仍 为 O(n?/ loga). 


9.3 小 结 


本 章 主要 介绍 了 在 网 拉 图 中 找 欧 拉 回路 以 及 竞赛 图 中 我 哈密 顿 回路 的 并 行 算法 .本 

章 讨论 的 欧 拉 回路 的 并 行 算法 将 在 后 而 一些 章节 中 作为 子 过 程 被 调用 、 

值得 指出 的 是 : 虽然 Awerbuch 等 人 的 算法 基本 思想 阅 本 章 介绍 的 算法 9.1 是 一 至 
的 ， 但 算法 9.1 看 起 来 似乎 更 容易 懂 。 尤 其 应 该 指出 的 是 : Tarjan EARR T 75 [UR 
反 的 两 条 边 后 变 成 的 欧 拉 图 ， 找 这 个 欧 拉 图 的 欧 拉 回 路 (路径 ) 非常 容易 ， 他 们 利用 树 上 
欧 拉 回路 使 得 耕 上 许多 操作 ， 如 求 两 个 顶点 的 最 低 公共 祖先 ， 计 算 每 个 顶点 离 根 的 深度 等 
问题 的 时 间 复杂 性 变 为 O(logn)， 而 仅 使 用 O(n) 处 理 器 ， 较 一 般 计 算 方 法 在 使 用 处 理 器 方 
面 降低 了 O(n) IT". 

对 于 一 般 的 图 ， 并 行 地 找 它 的 哈密 顿 路 径 或 回路 ， 肯 前 研究 还 不 是 太 多 ， 因 为 这 个 问 
题 的 串 行 算法 目前 仍 是 指数 复杂 人 性 的 岂 ， 但 对 一 些 特 殊 的 图 ， 其 哈密 顿 路 径 或 回路 已 有 人 
做 了 不 少 工作 ， 如 Soroker 等 人 曾 独 立地 给 出 找 竞赛 图 的 哈密 顿 路 径 的 并 行 算法 叫 。 
Bertossi 等 人 在 SIMD-CREW PRAM 上 ， 给 出 了 找 真 区 间 (Proper Interval Graph) 的 
哈密 顿 路 径 (回路 ) 算法 。 他们 的 算法 需 O(logn) 时 间 ，0O(m) 处 理 器 中，1989 年， 作者 
将 这 个 复杂 性 改进 到 O(logm) 时 间 、，0O(m) 处 理 器 (中 最近， 基 寺 SIMD-CREW 
PRAM, Dahlhans 等 人 对 稠密 图 (无 向 图 的 最 小 度数 为 n/2) 给 出 了 一 个 OCog’nyilt 
闻 、0O(n 处 理 器 的 找 哈 密 顿 回路 的 算法 "9. 
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流 图 在 工程 上 有 广泛 的 应 用 背景 。AOE Bi(Activity-On-Edge Network)， 又 称 分 析 
活动 网 ) 问题 在 系统 工程 、 网 络 分 析 等 领域 中 经 常 出 现 ， 求 一 个 网 络 的 最 大 流 最 小 割 问题 
是 许多 网 络 优化 设计 中 常常 遇 到 的 问题 。 本 章 我 们 介绍 这 两 个 问题 的 并 行 算法 。 


10.1 共享 存 贮 模型 上 的 AOE 网 问题 的 并 行 算法 


AOE 网 是 一 个 无 有 向 回路 的 有 向 图 GOE). 图 中 每 个 顶点 ie V 对 应 一 个 事件 ， 每 
条 有 向 边 <i,j> eE 对 应 网 上 的 一 个 活动 ， 且 每 条 有 向 边 赋 给 一 个 正 的 权 值 ， 它 表示 该 
边 上 的 活动 成 本 .不 失 一 般 性 ， 假 定 VTL 2. nh s RERA (起 始点 ) ，: 代表 
终点 ，seV，reV。 

AOE 网 问题 的 并 行 算法 涉及 三 个 于 问题 ， 第 一 ， 已 知 一 个 有 向 图 ， 其 边 赋 给 正 的 权 
值 w 后 ， 该 有 向 图 是 否 是 一 个 AOE 网 ; 第 二 ， 若 一 个 有 向 图 G(Y,E) 是 一 个 AOE 网 ， 
试 给 出 每 个 事件 的 执行 次 序 ， 即 求 AOE 网 的 拓扑 排序 ; 第 三 ， 试 找 出 AOE 网 的 关键 路 
fe. 在 下 面 各 节 ， 我 们 将 分 别 介绍 这 些 问题 在 SIMD 一 CRCW PRAM 上 的 并 行 算法 。 


10.1.1. AOE 网 的 存在 性 测试 算法 


检查 一 个 有 向 图 G(Y,E) 是 不 是 AOE 网 ， 其 必要 条 件 是 : 检测 G 是 否 含有 一 个 有 向 
回路 ， 这 是 因为 AOE 网 不 能 存在 有 向 回路 。 本 节 介 绍 的 检测 算法 是 Chaudhuri 等 人 建议 
is". 

1. 算法 的 基本 原理 

检测 一 个 有 向 图 CVD 是 否 含有 向 回路 的 一 个 直观 方法 是 ， 首 先 计算 G SIDE 
BER. 及 的 元 素 R(i,j) 定义 为 : 车 顶点 i 到 顶点 j 之 间 存 在 一 条 有 向 路 径 ， 则 RUJ) 
-3 否则 ，R(i,j) = 0。 其 次 判断 是 否 存在 一 条 边 <i,j> eE, EE RAAG) #0. 
这 里 4 E GREE, EREDA D 40, WERE RGF) #0( 即 是 1)， 司 
AGDA 即 是 1)， 也 就 是 说 ， 从 i 到 /存在 一 条 有 向 路 径 ， 从 j 到 :存在 一 条 有 向 边 . 
这 条 有 向 路 径 及 边 <j) i> 形成 G 中 的 一 条 有 向 回路 。 因 此 ， 一 个 有 向 图 G(Y,E) 
是 AOE 网 当 且 仅 当 对 任意 一 条 边 < i,j> eE 均 有 ROU.) 人 4(i,j)0. R 的 计算 可 通过 计 
算 G 的 邻接 矩阵 4 非得， 即 

R=(4+D =("((4 x ny 9 
其 中 是 阶 单位 矩阵 ， 


GO £A logn ERS, WA flogmi 个 2 
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2. 算法 的 形式 化 描述 


算法 10.1 TEST ALGORITHM 
输入 : EGO RHA; 
输出 : 图 G 是 不 是 包含 有 向 回路 ， 用 ”Fes% 和 “No 回答 . 
begin 
(i) RE AGT; / *ABBEHRER*/ 
(2) for llogm! iterations do / 8 计算 4 的 自 反 传递 闭 包 + / 
ReR*R Le "RAR / 
endfor ; 
(3) for each i, j:1<i,j<n pardo 
if R(G,J)AAGD «0 then Temp(ij)c— |! else Temp(i,) - 0 endif 
7 * 满足 条 件 则 存在 有 向 回路 * / 
endfor ; 
(4) for each i, j: 1 & i, j<a pardo 
B() - max{Temp(i,j) | 1 < j& nl 
endfor ; 
(5) for cach i: 1 «in pardo 
xemax(B()| 1<i<n} 
endfor ; 
(6) if x — 1. then return(" Yes") else return("No") endif 
/ * 落 存 在 有 向 回路 表示 G 不 是 AOE 网 * / 


end. 


定理 10.1 在 SIMD — CRCW PRAM 上 ， Bit—t+ AM G(V,E), IV] n BBS 
有 向 回路 ， 算 法 10.1 需要 O (loge) RR]. O(n’) 处 理 器 . 

证 明 ”由 算法 10.1 可 知 ， 第 (1) 3888 O(D ATRL, O(n?) 处 理 器 ; 第 (2) 步 涉 及 到 两 个 布尔 
乍 阵 的 逐 辑 乘 问 题 。 两 个 布尔 矩阵 的 逻辑 科 ， 在 SIMD - CRCW PRAM 上 ， 需 O(1) Itt 


阐 、0(w ) 处 理 器 .因为 允许 同时 向 某 一 单元 “等 ”， 使 得 计算 V (a, Ab) TE 


uides 


用 O(n) 处 理 器 在 O(1) 时 间 内 完成 。 故 第 和 2) 步 需 O(logn) BR]. O(n?) 处 理 器 ; 第 (3) 步 
需 0(1) 时 间 、0(n”) 处 理 器 ; 第 (4) 步 需 O(logn) WEI, O(n?) 处 理 器 ; 第 (5) Ib 
需 O(logn) B. O(n) 处 理 器 ; 第 (6) HE O(1) 时 间 及 处 理 器 ， 所以， 算法 10.1 
需 O(logn) IERI, O(n?) 处 理 器 。 
10.1.2 AOE 网 的 拓扑 排序 算法 

一 个 AOE KI G(Y,E) 的 拓扑 排序 是 指 对 图 的 顶点 《事件 ) 进行 排序 ， 且 排序 后 每 个 
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顶点 ieV 有 一 个 唯一 的 拓扑 序号 TG)， 若 顶点 i 是 顶点 7 的 前 趋 顶点 ， 则 ;i 应 排 在 /的 前 
Ti. BT) <T) 
L 算法 的 基本 原理 

并 行 拓 扑 排序 的 基本 思想 是 : 首先 计算 每 个 顶点 ie V 可 达 的 顶点 个 数 ， 然 后 将 顶点 
分 放 到 个 桶 中 。 放 人 桶 中 的 方法 是 :; 若 从 顶点 i 出 发 可 以 到 达 的 顶点 数目 为 则 把 项 
点 i 放 和 第 7 个 桶 中 ， 我们 用 二 维 数组 Bn En) 来 表示 n A. MUR B 的 每 一 列 HU 
一 个 桶 (1 xn). SEMIS 个 元 素 中 每 一 个 代表 一 个 唯一 的 单元 。 因 此 桶 j 的 第 i 个 
单元 是 B(i,j)， 开始 时 ，n 个 桶 的 每 个 单元 赋 初 值 为 0; 将 一 个 顶点 放 人 某 个 桶 的 一 个 单 
元 中 ， 只 需 将 此 桶 的 这 个 单元 赋值 1， 最 后 ， 并 行 地 修改 每 个 桶 的 单元 的 值 ， 使 得 修改 后 
的 值 是 所 有 前 面 各 桶 单元 值 的 和 、 再 加 上 本 桶 所 有 前 面 单元 (包括 计算 单元 本 身 ) 的 值 之 
Al. 即 对 给 定 的 7 来 讲 ， BOD A 


BG)- X DETUR DES IxLj&n 


然后 由 B 计算 每 个 顶点 ie V 的 拓扑 序号 TQ). 
2. 算法 的 形式 化 描述 


算法 10.2 TOPOLOGICAL SORTING 
输入 : G 的 邻接 矩阵 4 
输出 : 每 个 顶点 ie V HAAS TA. 
begin 
(D ReA+I; 
(2) for [logn] iterations do — / * TX Gp GAEREAETER * / 
ROR*R 
endfor ; 
Q) for each i, j: 1<i,j<a pardo / * 计算 每 个 顶点 可 达 的 顶点 个 数 * / 


CHO DREN: XO  Büj)eo 


P 

endfor ; 

for each i,j: 1 &i, j&n pardo / * STAR ARE / 

if C()—]j then B(ij)« endif 

endfor ; ^ 

(5) foreach ij: 1 & ií/&n pardo  /* 计 算 等 个 桶 的 部 分 和 * / 
for each p: 1x p<i pardo 


(4 


Bie X 80.) 
endfor 
endfor ; 
(6) for cach j: 1 x j&n pardo  /* 计 算 编 号 小 于 等 于 7 的 桶 所 含 数 据 总 数 * / 
for each q: 1 <q < j pardo 
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] 
XG- È Bln,q) 


endfor 
endfor ; 
(7) for each ij: 1<ij<n pardo / * 计 算 部 分 和 * / 
B(i,j) XU— 1) + BGS) 
endfor ; 
(8) for each i: 1 <ign pardo / * 计算 顶点 的 拓扑 序号 * / 
PSUM(i).—B(i,C()); Ti) n — PSUM(/) +1 
endfor 


end. 


下 面 我 们 证 明 算法 10.2 确实 能 正确 地 给 出 AOE 网 的 拓扑 排序 .在 一 个 AOE 网 中 ， 
车 项 点 i 是 顶点 7 的 前 不 顶 点 ， 则 顶点 可 达 的 顶点 i 也 可 达 。 这 是 因为 从 i 可 达 j; 及 
之 ?可 达 的 顶点 j 未 必 能 到 达 ， 即 C(i) > C(P)， 这 意味 着 PSUM()»PSUM(Q). 8 TG) 
< 了 (0) 这 同 拓扑 排序 的 定义 一 致 . 
定理 10.2 在 SIMD -CRCW PRAM 上 ， 对 一 个 AOE 网 G(V,E), [Vi=7 的 所 有 顶点 
进行 拓扑 排序 ， 算 法 10.2 需 OCogn) BER, O(n’) 处 理 器 . 
证 明 ”从 算法 10.2 可 以 看 出 ， 算 法 的 第 (1)~(2) 步 同 算法 10.1 第 (1)~ (2) 步 相间 ， 
需 O(llogn) MERI, O (n^) 处 理 器 ,第 (3) 步 需 O(logn) HEB). O(n") 处 理 器 ; 第 (4) 步 
FODHA, O(n”) 处 理 器 ; 第 (5)~(6) 步 需 O(logn) HT, O(n?) 处 理 器 ; 第 (7) 步 
EON, O(n?) 处 理 器 ; 第 (8) 步 需 OC) 时 间 、O(n) 处 理 器 。 故 整个 算法 
ff O(logn) BET], O(n’) 处 再 器 。 

图 10.1 给 出 了 一 个 AOE 网 的 例子 ， 用 算法 102 计算 它 的 拓扑 排序 的 结果 ， 列 在 表 
10.1 中 。 


图 10.1 AOE 网 示例 
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% 10.1 算法 10.2 对 图 10.1 MATER 


DIAREO ca PSUM(j) 
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10.13. AOE 网 的 关键 路 径 算法 


在 一 个 工程 项 目 中 ， 找 出 反应 工程 进展 的 关键 环节 ， 对 整个 工程 能 否 按期 完成 至 关 
重要 。 这 就 是 在 AOE 网 中 找 出 一 条 从 源 点 s 出 发 至 终点 ; 的 关键 路 径 . 

1. RRA MALE ALE 

在 介绍 关键 路 径 算法 之 前 ， 我 们 首先 给 出 计算 有 向 加 权 图 的 所 有 顶点 对 之 间 的 最 大 加 
权 略 径 权 值 的 算法 

设 G(V,E) 是 一 个 有 向 加 权 图 ，4 是 图 G 的 直径 。 一 棵 根 为 xer 的 树 T* 定义 
为 : T* 是 由 从 x 出 发 、 经 过 图 中 非 有 向 回路 的 有 向 路 径 到 达 的 所 有 顶点 组 成 ， 且 从 x 到 
这 些 项 点 的 路 径 长 度 不 超过 2*，0 < kk < Nogdl. ERT! 中 ， 若 存在 这 样 一 对 顶点 y 
及 z，<Jz> eB， 但 < yz > RET 的 边 ， 落 下 列 一 个 条 件 满足 ， 则 说 树 7* 保持 最 
大 加权 路 径 性 质 : . 

(1) 3E TL 中 从 到) 的 路 径 由 2* 条 边 组 成 ， 每 条 边 权 值 用 WOT?) 表示 ， 在 了 7* 
中 从 工 到 了 路 径 上 所 有 边 的 权 值 和 记 为 WOITE) 

Q) WOITL) + WGIT?) < WEITE) 

ER Ti b. Eh <y,z > 属于 了 * 的 边 ， 则 顶点 z BMA FET =y .约定 树 
Bx 的 Foxit) = x. 

找 一 个 有 向 加 权 图 的 所 有 最 大 路 径 树 算法 的 基本 思想 是 : 首先 假定 算法 的 输入 是 : 对 
每 个 xeF， 设 输入 为 了 "， 若 < y,x > ck, MEABE W (y | 了 ) W (yx); E 
则 WOITI)e — o. 算法 开始 时 ， 对 每 个 xeV， 将 所 有 满足 ye7' 的 树 Th AT 合 
并 ， 产 生 一 个 新 的 树 T ， 然 后 再 类 似 地 合并 下 去 ， 合 并 过 程 执行 Nogd 次 循环 后 ， 对 每 
个 xeV Bl RT IP, CERE x 的 一 棵 最 大 加 权 路 径 树 . 在 每 次 循 环 时 ， 
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树 了 * 是 由 树 TIC 和 所 有 树 T (yeTL ) 合并 得 出 的 ， 且 保持 最 大 加 权 路 径 性 
E(O<k< llogd!). 
2. 算法 的 形式 化 描述 


算法 10.3 FINDING MAXIMUM WEIGHTED PATH 
输入 : AT Axey, AFOOT AEAT Yyev; 
输出 : 对 每 个 xeV， 输 出 根 在 x 的 最 大 加 权 路 径 衬 ， 用 Fly| 了) 表示 了” 


flogdl 


y=, 2, =, n, Hyer, 
procedure Max path(G) ; 
begin 
(1) k-0; 
(2) while k< flogd1 do — / * HIRAM! sw / 
(3) for each x,y,z: 1 &x, y,z &« n pardo 
if (z = x) MPOT?) #0) 
then Mf (y,2)— WOITE) 
else if (ze TACITI) +0) 
then M*(y,z) - WGIT^) + WOTE) 
else M'(y,z)e- — oo 
endif 
endif 
endfor ; 
{ for each x,y,z: l&x,y,z«&n pardo / * MRR ROL +/ 
Mi (yy, ) max (M Quz) | 2512, nd 
endfor ; 
6) kek4l; 
(6 foreach x,y: 1x x,y &n pardo / * 调整 最 大 路 径 树 的 父 结 点 * / 
k-l 


FO IT Fy rt") 


Ya 


endfor ; 
(T) for each x,p:i<x,y<n pardo / * 修 改 最 大 路 径 边 上 的 权 值 * / 
WOIT)e- WOIT + WITS) 
endfor 
endwhile 


end. 
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3. 算法 的 正确 性 证 明 
在 分 析 算法 10.3 复杂 性 之 前 ， 先 对 它 的 正确 性 给 予 证 明 。 
引 理 10.1 XHEMA xev, WIE 10.3 经 过 大 次 连续 循环 后 得 出 的 树 T*， 是 由 从 x 出 发 


可 达 的 顶点 组 成 的 ， 且 从 x 到 这 些 顶 点 的 非 有 向 回路 路 径 长 度 «2^. O<k < Tlogd1. 
证 明 XHEX xer， 用 归纳 法 对 大 施加 证 明 。 当 天 ~ 0 时， 引 理 显然 成 立 ， 因 为 根据 7 


SX. ERU Guy)e E 的 顶点 上 ZUR. BBUETE LT EIE. ETT, 使 得 引 理 10.1 成 立 ，x 
er。 现 证 明 ;一 大 二 1 时 引 理 10:1 成 立 ， 考 虑 一 个 顶点 pé s ER G 中 存在 一 条 长 
度 小 于 等 于 2'*' 的 非 有 向 回路 。 由 算法 10.3 的 第 (3)~ (6) 步 可 知 : Eye TIU, MER 
着 存在 这 样 的 项 点 x， 使 得 weT' 且 ye 了 ;由 归纳 假设 ，T' 含有 图 G 的 那 种 顶点 集 
E PAu 出 发 长 度 小 于 等 于 2^ 的 非 有 向 回路 的 可 达 顶 点 集合 。 因 此， 对 任意 weT' 来 
讲 ， 当 yp#T' 且 y#T'， 则 在 图 G 中 从 x A y 的 每 条 非 有 向 回路 长 度 大 于 2 +2' 


= 2 ， 这 与 关于 的 归纳 假设 相 矛 盾 。 赦 对 每 个 顶点 yer, HM x 出 发 可 达 它 的 非 有 
向 回路 路 径 长 度 小 于 等 于 2 ， 则 yer ， 


引 理 10.2 ”对 任意 一 个 xey， 经 算法 10.3 的 第 (3) ~ (6) 步 连 续 循环 后 的 树 T+， 将 不 包 
HGO, E) 的 那样 的 顶点 y， 使 得 G 中 从 x HABA y 的 非 有 向 回路 路 径 长 度 大 
F2*, 0<k< llogd!. 

证 明 ”类 似 引 理 10.1 的 证 明 , 

引 理 10.3 ”在 算法 10.3 的 第 (3)~ (6) 步 的 第 k 次 循环 结束 时 ， 对 任意 的 xey， 由 了 


以 及 所 有 TL (yeT, )， 形 成 的 合并 树 了. ， 保 持 最 大 加 权 路 径 性 质 ， 
证 明 ”归纳 基础 . 大 一 0 时 ， 由 7" 定义 ，T? 保持 最 大 加 权 路 径 性 质 ，xeV， 归 纳 假 
设 . 设 对 一 个 整数 一 i 来 讲 ， 每 樟树 7 保持 最 大 加 权 了 路径 性 质 ， 现 考虑 上 = i+ 1 的 
wri, Cha T 及 所 有 T'(weT') 的 树 合并 后 形成 的 对 每 个 yeT'，weT' 的 顶 
Bo. 我们 在 TU 选择 上 的 父 顶 点 z = FUT), BERG 中 不 再 存在 另 一 个 顶 
Nou(uzz. 满足: 

W(w| Ti 
由 算法 10.3 的 第 (4) ~ (6) 可 知 ， 这 样 的 选择 是 可 行 的 根据 归纳 假定 ， 每 棵 树 7 保持 最 
大 加 权 路 径 ，xeV。 因 为 在 图 中 任意 一 条 从 x 到 y HRB, ET RT, 都 保持 这 条 路 
径 的 最 大 加 权 路 径 性 质 ， 则 最 大 加 权 路 径 的 权 值 必须 大 于 等 于 Wy (T+ Wz1T，) 
FW 1?)， 然 而 我 们 可 以 选择 FOIT) 688 


1 


)+ WIT) > WG, IT) WEIT, )- WOIT) 
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Pel 


WO ITI) Wo, T) WEIT, + WOT) 
Bub, TU RK ARE 


由 上 述 诸 引 理 可 知 ， 对 每 个 顶点 xeV， 树 了 ,是 图 G 的 以 x 为 根 的 最 大 加 权 路 


径 树 ， 
定理 10.3 在 SIMD 一 CRCW PRAM 上 ， 对 一 个 非 有 向 问 路 的 有 向 加 权 


G(V,E). |Vien, SERE BUR BUR xeF 的 最 大 加 权 路 径 树 T ， 算 法 10.3 
需 OGogdloglogn) RE]. O(n") 处 理 器 ， 这 里 d 是 图 G 的 直径 ， 

证 明 ”通过 对 算法 10.3 复杂 性 分 析 来 证 明定 理 . 第 (D 步 需 OC) 时 间 及 处 理 器 ; 第 (3) 
ERORA, O(n") 处 理 器 ; 第 (4) RR a 个 元 素 最 大 值 运算 ， 运 用 Shiloach 等 人 
的 算法 ， 求 # 个 元 素 最 大 值 需 OCoglogn) 时 间 、O(n) 处 理 器 ， 故 第 (4) 步 需 O(loglogm) 
RE O(n") 处 理 器 ;第 (5) ~ (6) 步 需 0(1) BTA. O(n”) 处 理 器 ; 而 while Hi 环 需 执 
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图 10.2 算法 10.3 对 图 10.1 的 执行 结果 
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47 rlogd1 次 、 故 整 个 算法 10.3 需 O(logdloglogn) 时 间 、O(n ) 处 理 器 . 

图 10.2 给 出 了 图 10.1 在 执行 算法 10.3 的 前 两 次 循环 后 的 各 个 最 大 加 权 路 径 树 ， 
4 求 AOE 网 的 关键 路 径 - 

设 每 个 活动 < i,j> ek 的 最 早 开始 时 间 为 EST(i,j)， 最 迟 开始 时 间 为 LST(i,j)， 松 
弛 时 间 (Slack Time) 为 SLACK(i,j)， 显 然 ， 

SLACK(,/) = LST(i,/) — EST(,/) 

一 个 活动 «ij» eE 是 关键 活动 当 且 仅 当 SLACK(i,j) = 0， 因 而 一 条 从 源 点 s 到 终点 上 
的 路 径 了 是 关键 路 径 当 且 仅 当 对 P 上 每 一 条 边 < x,y > 均 有 SLACK(x,y) = 0， 这 一 性 
质 给 出 了 计算 关键 路 径 的 算法 .下面 我 们 给 出 形式 化 描述 的 算法 . 


算法 10.4 FINDING CRITICAL PATH ON AOE NETWORKS 
输入 : G 的 邻接 矩阵 4 及 加 权 邻 接 矩 阵 W; 
输出 : ESEAEHRSLACK, SLACK(i,/) = 0 表示 边 <i,j> 是 一 个 关键 活动 . 
procedure Gritical__Activities(G) ; 
begin 
(D call Max path(G); /* 计算 G 的 最 大 路 径 树 > / 
(2) for each i, j: 1 & i,;& n pardo 
/ * 计算 每 个 活动 ig 的 最 早 开始 时 间 及 最 迟 开始 时 间 * / 
LST(, - WEIT, )— wi T, )— wg T: 


EST(,J) WGI T," 
endfor ; 
(3) for each ij: ES ij&n pardo  /* 计 算 每 个 活动 <i,j> 的 延迟 时 间 * / 
if «ij» eE then SLACK(i,j)~ LST(,j) — EST(i,/) 
else SLACK(1,]) - — 1 /* 特殊 标记 * / 
endif 
endfor 
end . 


上 述 过 程 执行 结 果 ， 在 某 条 从 s 至 上 的 路 径 上 所 有 的 边 <i,j> ek RA SLACK(,/) 
= 0， 则 这 条 路 径 是 AOE 网 的 关键 路 径 。 : 
定理 10.4 在 SIMD — CRCW PRAM 上 ,计算 一 个 AOE 网 G(V,E), |V| — n 的 关键 路 


径 , 算法 10.4 需 O(logdloglogn) 时 间 、O(n ) 处 理 器 ， 这 里 4 是 图 的 直径 
证 明 ”在 算法 10.4 中 ， 根 据 定理 10.3， 第 (1) 步 需 O(logdloglogn) MYT]. O(n’) 处 理 器 ; 
第 (2)~ (3) 步 分 别 需 0(1) BY. O(n?) 处 理 器 。 因 此 ， 整 个 算法 需 O(logdloglogn) 时 


B. O(n”) 处 理 器 
对 图 10.1 的 AOE 网 ， 每 个 活动 «ij eEE 的 最 早 开始 时 间 EST(i,j)， 最 迟 开 始 时 
闻 LST(,/) 和 松弛 时 间 SLACK (i,j) 列 出 在 表 10.2 中 。 
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R102 图 10.1 的 每 个 活动 的 最 早 开 始 时 间 、 最 迟 开 始 时 间 以 及 延迟 时 间 


bi4 ESTG,j ) LSTG,j) SLACK(:,j ) 
<1,2> 0 0 0 
<13> 0 1 1 
«M» 0 1 1 
«25» 6 6 0 
<35> 4 5 1 
<4,6> 5 6 1 
<4,7> 5 7 2 
<5,8> 7 10 3 
«59» 7 7 0 
«69» 12 13 1 
«19» 7 il 4 
<7,10> 7 5 2 
«8,107 13 16 3 
«9,10. 14 14 0 


10.2 超 立 方 和 洗 牌 网 络 上 的 AOE 网 算法 


在 第 七 章 我 们 介绍 了 Deke 等 人 基于 超 立 方 和 洗 牌 网 络 上 的 矩阵 先 法 算法 ， 这 里 我 
们 介绍 他 们 的 计算 AOE 网 络 拓扑 排序 和 关键 路 径 算法 中 . 


10.2.1 超 立 方 洗 牌 网 络 上 的 拓扑 排序 算法 


在 超 立方 和 洗 牌 网 络 上 实现 拓扑 排序 的 算法 ， 要 充分 利用 这 两 个 网 络 上 的 快速 矩阵 
RARE. Dekel 等 人 的 算法 正 是 利用 了 这 一 点 。 
L 算法 的 基本 原理 

假定 G(V,E) &—^- AOE N, V= {1，2，--…，n} 。 拓扑 排序 算法 的 基本 思想 是 : 
首先 计算 每 对 顶点 间 的 最 长 路 径 长 度 ， 设 'G 的 每 对 顶点 闻 的 最 长 路 径 和 矩阵 用 已 表示 - P 
的 初始 值 为 : 


1, Hp <ij> ek 
ED Biss 
—o, %4 <ij>¢E 


矩阵 P 可 通过 计算 所 有 顶点 对 的 最 短路 径 算法 获得 ， 但 在 这 里 必须 用 “max” 操作 蔡 
换 最 短 咯 径 算法 中 的 “min* 操作 ， 其 结果 是 : 对 应 PKS HORS fU 
fid d, od. q«i, «n 1«j«n BRUM, ip uo i, 没有 前 趋 的 顶点 . 
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然后 ， 对 PP 的 每 个 不 全 为 0 BUR ACR TATE i. tp 


—U sj «n, Leis DA 


RABADA d. ms d, 到达 je sors JL OBER BMEREE, Uo 1, . SUR 8 
个 顶点 iey， 形 成 一 个 序 偶 Qu. isip ip m i MT COs IG, OY, 进行 
非 降 排 序 ; 排序 的 结果 ， 著 茶 个 顶点 1 排 在 第 个 位 置 ， 则 项 点 i, 的 拓扑 序号 就 
是 k，1< <n 这 样 就 能 给 每 个 顶点 赋予 正确 的 折 冰 序号， 因为 车 1 是 /的 前 趋 顶点 

RE, <i, FG, D efe 0, 7) 之 前 ， 即 顶点 i 的 拓扑 序号 小 于 顶点 的 拓扑 序号 ， 这 


同 拓扑 排序 的 定义 是 一 致 的 
2. 算法 的 非 形式 化 描述 


算法 10.5 FINDING TOPOLOGICAL ORDERS ON NETWORKS 
输入 : G 的 邻接 矩阵 4; 


输出 : 每 个 顶点 iey 的 拓 相 序号 T( 有 ， 存 放 在 编号 为 (0, 0, 1 一 DIES P, 


begin 


[6 


(2 
Qo 


(4 


> 


{5 


(8) 


for cach ij: 1 « i,j« n pardo / akàn / 
if 4(,/)—1 then P(i,j)-1 
ele if i=j then P{i,j)—0 else P(i jy- — œ 

endif 
endfor; 
HATH AG HAABARARKBALKREM P; 
for cach i,j: 1 « i,j&n pardo 

if P(i,j) &0 then B(ij)—0 else B(i,j) — P(i,/) endif 
endfor ; . 
for cach i,j: 1 « i,« n pardo 

P(t) max (BG,j) | « J«n] 
endfor; 
for each i: 1 «i «n pardo 

if P(14)-0 
then C(i)—1 /*i 没有 前 趋 顶点 * / 
ebe C()-0 — /*i 有 前 趋 顶点 * / 
endif 

endfor ; 
for each i,j: 1<i,j<n pardo 

if P(,) 40 


endif 


then if C(j)#0 then Temp(i,j)— P(i,/) else Temp(i,/)— — 1 endif 


else Temp(i,]) - — I 
endif 
endfor ; 
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(7) for each i,j: 1 <i,j<n pardo 
if P(1,j)#0 then P(1,/)«*- max {Temp(i,7)} endif 

endfor ; 

(8) FERPA, D, 了), j=l, 2, ns nAIRE. aA. BCPC, D, 门 在 处 
理 器 (0,0 k)h, BRIEARJRSG TO), XTTU)-k c1, O<k <n; 

(9) 5E RS ARIES. BFA, 0, i) 处 理 器 存放 着 顶点 i+ 1 的 拓扑 序号 
T1) 

end. 


本 节 假 定 超 立 方 或 洗 牌 网 络 处 理 器 的 编号 同 第 七 章 的 编号 一 致 ， 且 假定 有 n 个 处 理 器 . 
算法 10.5 的 第 (D ~ (2) 步 是 计算 所 有 顶点 对 之 间 的 最 长 路 径 长 度 矩 阵 P: 第 (3)~(5) 
步 是 找 出 所 有 没有 前 趋 的 顶点 i， ，i，,，-…，i; 第 (6)~ (7) 步 是 计算 每 个 有 前 趋 的 顶 
SJ dote Ad. Lh. i BILL rms PETERE HE 第 (8)~ (9) 步 给 顶 
点 赋予 拓扑 序号 并 指出 这 些 拓扑 序号 的 存放 位 置 ， 
定理 10.5 ”在 超 立方 和 洗 牌 网 络 上 ， 计 算 一 个 AOE G(V,E) IV] o n 的 拓扑 排序 ， 算 
法 10.5 需 O(log^n) AIT. O(n”) 处理 器 . 
证 明 ”算法 10.5 的 复杂 性 分 析 如 下 : 第 (1) 步 需 O(D TL. O(n”) 处 理 器 ; 根据 定 
理 7.8， 第 (2) 步 需 O log^n) MT. O(n?) 处 理 器 ; 第 (3) 步 需 0(1) TL. O(n) 处 理 
器 ; 第 (4) 步 需 O(logn) WER. O(n?) 处 理 器 ; 第 (5) 步 需 0(1) HE. O(n) 处 理 器 ; 
第 (6) 步 需 O CL) WH. O (n^) 处 理 器 ; 第 (7) 步 需 O(logn) WE. O(n") 处 理 器 ; 
第 (8)~ (9) 步 利用 Nassimi 等 人 的 排序 算法 ""， 在 ”处 理 器 的 超 立 方 和 洗 牌 网 络 上 ， 
ff O(logn) 时 间 ， 因 此 整个 算法 需 Olog n) 时 间 、O{n ) 处 理 器 - 


10.2.2 ”起 立方 和 洗 牌 网 络 上 的 关键 路 径 算法 


在 10.1.3 节 我 们 已 叙述 过 ， 一 旦 找 出 AOE 网 的 关键 活动 后 ， 那 么 ， 若 从 源 点 * 至 
终点 上 的 路 径 工 上 所 有 边 的 活动 都 是 关键 活动 ， 则 称 工 为 这 个 AOE 网 的 关键 路 径 。 
对 每 个 活动 < i,j> eF 的 最 早 开始 时 间 是 从 s 到 ;的 所 有 路 径 上 ， 其 时 间 权 和 最 大 的 
值 作为 的 最 早 开 始 时 间 ， 因而 可 利用 上 一 节 计算 最 长 路 径 来 计算 最 早 开始 时 间 甜 
REEST. EST 的 初 值 定义 如 下 : 
Wij), <ij>eE 
semen [o i=j 
—0, <ij> 4E 
类 似 地 ， 我 们 可 以 得 到 活动 的 最 迟 开始 时 间 和 矩阵 LST， 具 体 做 法 是 : 4 G'(V, E") 是 这 样 
一 个 图 ， 其 中 Ei= { <i>|<ij>eE} .从 + 出发， 计算 G' 的 所 有 顶点 对 的 最 短路 
径 矩 阵 LST1, LSTI 初 值 定义 为 ; 
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Wi), <i,j> eF 
svn i=j 
+0 <i,j> éE 


WY LSTG,j) = LST(s,1) — LST1G,/) Wij) «ij» eE. 所以， 每 个 活动 <i,j> eE 
的 松弛 时 间 为 : 

SLACK(i, j) = LST(i,/) — EST(i,/) 
因此 ， 一 个 活动 «ij» eE 是 关键 活动 当 且 仅 当 SLACK(,J) = 0. 

在 超 立 方 和 洗 牌 网 络 上 求 关 键 路 径 算法 的 非 形 式 化 措 述 如 下 : 


算法 10.6 FINDING CRITICAL PATH ON NETWORKS 
输入 : Gabi Ww; 
输出 : 每 个 活动 <i,j> cE 的 最 早 开 始 时 间 EST(i,j)， 最 迟 开始 时 间 LST(i,j)， 松 弛 
时 间 SLACK(i,j)， 并 标识 哪些 活动 是 关键 活动 。 
begin 
(1) HARP EEST ; 
Q) AAS VED: 
(3) HEA MEUSE IRL XC EAS AERELSTI ; 
(4) HERR ELST: 
(5 ILE Heng AEMESLACK ; 
(6) 判别 哪些 活动 是 关键 活动 


end. 


定理 10.6 ”在 超 立 方 和 洗 牌 网 络 上 ， 计 算 一 个 AOE 网 G(,E), V= n 的 关键 路 径 ， 算 
法 10.6 需 O(log ^n) RYT]. O(n^) 处 理 器 , 

证 明 “在 由 个 处 理 器 组 成 的 超 立 方 和 洗 牌 网 络 上 ， 我 们 来 分 析 算法 10.6 的 复杂 性 ， 
算法 的 第 (1) 步 ， 由 算法 10.5 的 第 (1)~ (2) HATA. E O og n) BEM. O(n”) 处 理 器 ; 
第 (2) 步 仅 需 OL) 时 间 、O(n”) 处 理 器 ; 第 (3) 步 由 定理 7.8 可 知 ， 需 O(log”n) 时 
lj. O(n?) 处 理 器 ; 第 (4) 步 涉及 着 先 广播 EST(s,z) 至 网 络 的 每 个 处 理 器 ， 故 这 一 步 至 多 
W Ollogn) RE]. O(n”) 处 理 器 ; 第 (5)~(6) 步 显 然 需 OOE O(n”) 处 理 器 .因此 ， 
整个 算法 需 Ollog*n) RESI. O(n”) 处 理 器 . 


10.3 AOE 网 的 分 布 式 算 法 


Chaudhuri” 曾 基于 消息 异步 通信 的 分 布 式 计算 模型 ， 对 AOE 网 G(V,E) 建议 了 一 
个 计算 每 个 事件 Le V 的 最 早 开始 时 间 、 最 迟 开始 时 间 以 及 松弛 时 间 的 分 布 式 算法 ， 本 节 
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我 们 介绍 这 个 算法 。 
假定 对 每 个 结 点 ie V. XEXCN LG) du | «uu eB} 为 进入 边 的 另 一 端点 集 


合 ，N = 和 | «iv» eB} 为 射出 边 的 端点 集合 。 分 布 式 算法 分 为 两 个 阶段 :第 一 阶 
段 ， 计 算 每 个 结 点 ie 的 最 早 开始 时 间 ESTO 第 二 阶段 ， 计 算 每 个 结 点 Ie v MER 
始 时 间 LST(D 以 及 松弛 时 间 SLACK(). 


10.3.1 算法 的 形式 化 描述 


在 第 一 阶段 开始 前 ， 每 个 结 点 拥有 N O N (OR Wo. V keN,(). 在 第 
一 阶段 终止 后 ， 每 个 结 点 i 已 经 给 EST() 赋值 。 在 结 点 * 初始 化 算法 中 检测 第 一 脐 段 是 否 
终止 执行 . 


算法 10.7 CRITICAL PATH ALGORITHM AT FIRST STAGE 
begin 
源 结 点 s 的 算法 : 
初始 化 : 
n (oN; EST()-0; 
send (SET; EST(s)) message to i, for all ieN,, (s); 
upon receiving TERM message from node i do: 
n ()en (s)-1; 
if n (s) —O then terminate Phase I endif; 
RR i 的 算法 : 
初始 化 : 
2*0 IN GR; n ON, Ol: ESTO- — o; 
upon receiving (SET; d) from node j do: 
if EST() «d + WU.) 
then EST() - d+ WU i); 
a^ ()on*()-1; 
ifa" @=0 
then if N (s 
then send (SET;EST(i) to k, for all ken, (i) 
else send TERM message to j, for all jeN, (i); 
terminate 
endif 
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upon receiving TERM message from node k do: 
n (en (0—1; 
if n^ (i)=0 then send TERM message to j,for all JEN); 


terminate 
endif 
end. 


在 第 二 阶段 开始 前 ,每 个 结 点 ie 有 局 部 变量 N, O VD. ESTG) 
REGJ} VW jEN(D。 在 第 二 阶段 终止 时 ， 每 个 结 点 ie V HA LSTG) 及 SLACK(i) 
值 ， 结 点 : 起动 算 法 并 终止 算法 的 执行 . 


算法 10.8 CRITICAL PATH ALGORITHM AT SECOND STAGE 
begin 
WA o: 的 算法 : 
初始 化 : 


n*()-|N (0; LST) EST(D); SLACK()<0; 
send (SET; LST(#)) message to node i, for all ieN (0); 
upon receiving TERM message from node i do: 
n'()en'()-1; 
if n" (r) - 0 then terminate Phase II endif; 


一 般 结 点 (E DX: 
初始 化 : 


Aa DW Os a OIN Os LST Ao; 
upon receiving (SET; d) from node j do: 
if LST(i) >d- W(i,j) 


then LST(i)<—d—  W(iJ) ; 


n (on (0-1; 
ifn” ()-0 à 
then SLACK(i) +- LST(i) ~ EST(i) ; 
ift N (0*6 


then send (SET; LST(i)) message to j, for all JEN, @ 
else send TERM message to k, for all k EN wD; 
terminate 
endif 
endif 
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endif ; 
upon receiving TERM message from j do: 
n*en* (0-1; 
ifn*(@=0 
then send TERM message to į for all jeN, (i); 
terminate 
endif 
end. 


10.3.2 算法 的 正确 性 证 明 


算法 在 第 一 阶段 的 正确 性 证 明基 于 下 列 诸 引 理 。 
引 理 10.4 ERRERA, EMA EV- fs} 将 从 每 个 jeN, {i) 收 到 一 个 SET 消息 。 
证 明 ”我 们 假定 一 个 结 点 i eV —{s} 在 从 每 个 pe N ,全 KE] SET 消息 后 将 成 为 源 结 点 ， 
X EST() 及 发 送 SET 消息 至 每 一 个 jeN,, 0). EN, (6. BETEA G HMR. 


源 点 s 在 起 动 第 一 阶段 的 算法 后 ， 置 BST(s) 并 发 送 SET HART KEN, (5), RES 
已 从 G 中 删除 .得 到 的 疼 仍 是 一 个 无 有 向 回路 的 有 向 图 。 因 此 ， 在 该 图 中 至 少 有 一 个 结 
点 上 从 每 个 qeN,(k) 收 到 SET 消息 ， 它 成 为 源 结 点 ， 然 后 假定 它 也 从 图 中 删除 。 根 据 归 
纳 假 定 ， 在 有 限时 间 内 ， 每 个 结 点 ie V — (5) 都 将 在 收 到 每 个 je N, (0) 发 来 的 SET 消 
息 ， 然 后 成 为 源 结 点 。 如 果 存 在 一 个 结 点 iV- fs}， 在 有 限时 间 内 并 没有 收 到 所 有 . 
SN (i) 发 来 的 SET 消息 ， 那 么 至 少 有 一 个 peWu (i) 没有 收 到 所 有 re Ni (p) 发 送 的 SET 
消息 。 其 结果 是 ， 或 者 没有 发 送 SET 消息 ， 或 者 G 不 连通 。 这 两 种 情况 都 不 存在 。 故 
引 理 成 立 . 
引 理 10.5 第 一 阶段 是 会 终止 的 . 
证 明 ”由 引 理 10.4 可 知 ， 在 有 限时 间 内 ， 终 点 上 收 到 每 个 jen, (1) 的 SET 消息 后 ， 在 
E ESTG) 及 发 送 TERM 消息 至 每 个 jeNu(6 后 停止 执行 ， 同 引 理 10.4 类 似 的 讨论 ， 可 
以 证 明 最 终 源 结 点 s 将 从 每 个 ieN,(s) 收 到 TERM 消息 ， 终 目 第 一 阶段 ， 故 引 理 成 立 。 
定理 10.7 ”第 一 阶段 的 算法 在 有 限时 间 内 能 正确 地 计算 每 个 结 点 ie V 的 最 早 开 始 时 
Ig] EST(). 4 
证 明 ”根据 算法 10.7 "DÀ, MRP ie V, Hixs, WH EST() = max(EST() 
+ WOUDEN G0. HEST(s)=0. BH ESTO) 的 定义 是 一 致 的 。 又 由 引 理 10.4 及 引 
3810.5 知 ， 第 一 阶段 在 有 限时 间 内 会 终止 的 . 
第 二 阶段 正确 性 的 证 明 同 第 一 阶段 的 类 似 ， 故 不 装 述 。 

定理 10.8 ”在 异步 通信 的 分 布 式 计算 模型 上 ， 计 算 一 个 AOE 网 G(YV,E), |V|=n,1El 
=m 的 关键 路 径 ， 算 法 10.7 及 10.8 需 Od) 时 间 ， 而 通信 复杂 性 为 0(dm)， 其 中 4 是 图 
的 直径 。 
证 明 ”对 某 个 结 点 ON UO wb. NL O40, SH jeN, (i) RBS iM SET 消息 
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都 引起 EST) 值 发 生 改变 。 这 样 结 点 i 发送 的 SET 消息 数 将 是 IN (OE IN OL BEE 
点 j 的 TERM 消息 为 O(IN,,(DD)。 叉 从 s 到 4 的 最 长 路 径 为 0(4)， 故 第 一 阶段 的 通信 复 
杂 人 性 为 0(dm)。 又 G 是 非 有 向 回路 的 有 向 图 。 因而 时 间 复 杂 性 为 0(d)， 第 二 阶段 网 第 一 
阶段 的 通信 复杂 性 及 时 间 复 杂 性 在 大 “0O” 意 义 下 是 一 样 的 ， 故 整个 算法 的 时 间 复 杂 人 性 
为 0(4)，、 通 信 复杂 性 为 O{dm),，1 < 4d «n. 


10.4 最 大 流 问题 的 并 行 算法 
Shiloach 等 人 基于 SIMD 一 CRCW PRAM 计算 模型 ， 曾 建议 了 第 一 个 有 向 流 网 络 


的 并 行 算法 ”。 假 定 计算 模型 的 “同时 写 ” 仅 是 写 人 “相同 的 值 ”时 写成 功 。 本 节 我 们 介 
绍 这 个 求 最 大 流 问题 的 并 行 算 法 ， 


10.4.1 有 向 流 网 络 的 基本 概念 


一 个 有 向 流 网 络 N = (G, s, 1,0) 是 一 个 四 元 组 ， 其 中 : G = G(Y,E) 是 一 个 有 向 
Eis. 是 G 的 两 个 特殊 顶点 ， 它 们 分 别 是 源 点 及 终点 ，seV，teV; “是 一 个 已 及“ 
AK, RI 是 正 实数 域 ， 即 每 条 边 eeE 都 版 有 一 个 非 负 的 容量 c(e). 我 们 Ad, O) 
Bd (AIG G 的 顶点 v 的 进入 边 数 和 射出 边 数 ，veV. 


一 个 函数 f: EF 一 了 ”是 一 个 流 Flow), FEWER: 
{a) 容量 规则 : 
f(e)&c(e), VeeE; 
(b) 守恒 规则 ; 、 
IN(f, v) = OUT(/») Vvev — fs, th 
其 中 : INQ,v)- X fu) ”是 所 有 流 人 + 的 流量 之 和 ; 


OUTA V= X f() ”是 所 有 从 v 流 出 的 流量 之 和 。 


一 个 流 了 的 值 为 : 
| f|=OUT(, s) — IN(f, s) . 

一 个 流 /是 最 大 流 (Maximun Flow)， 若 存在 任何 其 它 的 流 f > BAIS e 一 个 流 f 
使 得 一 条 边 ee 忆 满足 fle)= c(e)， 则 称 f 使 边 。 饱和 ，e 称 为 饱和 边 (Staturated Edge). 
网 络 N 中 的 一 个 流 是 最 大 的 ， 若 从 s 到 1 的 每 一 条 有 向 路 径 上 至 少 有 一 条 饱和 边 ， 

一 个 有 向 网 络 N — (G, s, t, c) 是 一 个 层次 网 络 ， 车 G 具有 下 列 性 质 : 

(D 每 个 顶点 veV 有 一 个 层 号 Iv); 

(2) Ks)=0 OK) <i), VveV; 

3) #<uv>eck, Miv)—Mu)=1. 
DARL, = fv I= A 称 为 G6 的 第 j 层 ,0 < fx), 
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10.4.2 最 大 流 并 行 算法 的 高 层 描述 


首先 我 们 假定 网 络 N = (G, s, 1, 0) 是 一 个 层次 网 络 。 这 里 介绍 的 最 大 流 算法 正 是 基 

于 这 种 层次 网 络 。 
1， 算 法 的 基本 原理 

并 行 算法 是 由 许多 “脉冲 ” 步 组 成 的 . 算法 的 基本 思想 是 : 在 第 一 个 脉冲 时 ， 源 s 将 
饱和 它 的 所 有 射出 边 。 在 以 后 的 每 个 脉冲 时 ， 网 络 N 的 顶点 集 洲 一 {5,f} 被 划分 为 平衡 项 
点 (Balanced Vertice) 和 不 平衡 项 点 ”两 个 集合 ， 在 一 个 脉冲 持续 时 间 内 ， 平 衡 顶点 不 做 
任何 工作 ， 但 不 平衡 顶点 则 试图 将 尽 可 能 多 的 额外 流量 (Excess Flow) 向 前 推进 ， 若 它们 
不 能 按 这 种 方式 将 所 有 额外 流量 消耗 挤 ， 则 将 剩余 的 额外 流量 向 后 返回 。 向 后 返回 的 流量 
按 “ 后 进 先 出 ”规则 进行 ， 

一 个 顶点 vey 成 为 阻塞 (Blocked) 顶点 ， 若 它 的 所 有 射出 边 或 是 饱和 边 或 是 进入 一 个 
在 上 一 个 脉冲 时 阻塞 的 顶点 。 假定 终点 : 绝对 不 会 阻塞 ， 
2. 算法 的 非 形式 化 挤 述 

为 便于 描述 算法 ， 这 里 定义 一 些 变 量 如 下 : 
EXCESS(y): 表示 从 顶点 veV 应 该 向 前 推进 或 向 后 返回 的 额外 流量 ， 它 等 

FIN( v) - OUT(f vy 
AVAILABLE(v) 它 是 y 的 射出 边 的 一 个 子 集 ， 由 非 饱和 边 以 及 那些 不 进入 到 一 个 盟 蹇 项 
点 的 边 组 成 ; 

A_FLOW_QUANTUMEe, qy 表示 在 某 个 脉冲 ， 通 过 边 e 的 流量 值 为 9 . 

要 使 从 一 个 顶点 "返回 的 流量 保持 “后 进 先 出 ”规则 ， 我 们 用 一 个 栈 STACK(y) 记录 
进入 vy 的 流量 . 栈 STACK Q) 内 的 每 个 流量 用 二 元 组 (e = < u,v > ,9) 形式 存 贮 。 

BT LEN, 下 面 我 们 给 出 每 个 顶点 ”的 额外 流量 向 前 推进 的 PUSH 操作 过 程 以 
及 向 后 返回 的 RETURN 操作 过 程 的 细节 . 


算法 10.9 PUSH OPERATION 
procedure PUSH (v, EXCESS(y)) ; 
begin 
/* FRR v 存在 额外 流量 且 可 以 流出 ， 则 执行 while 特 环 体 。* / 
(1) while EXCESSfy) >0 and AVAILABLE(v) 2 $ do 
e«the first edge of AVAILABLE(); 

/* 找 出 第 一 条 可 以 流出 的 边 e 二 <vw> */ 
g+min{e(e)— f(e), EXCESS(v); / * 边 e 可 流出 的 流量 值 * / 
add Q ={e,9) to STACK(w); 

f(e)— f(e) - 4. EXCESS(v)— EXCESS(v) - ¢; 
if f(e)=c(e) then AVAILABLE(y) AVAILABLE(») — fe] endif 
/ * $21 e 饱和 ， 虽 从 集 AVAILABLE(y) 中 删除 。 */ 


一个 顶点 v 是 平衡 顶点 ， 车 IN(fY)=OUTCAY); 一 个 顶点 ， 是 不 平 癸 项 点 ， 若 INC)» OUTUA 


—178— 


endwhile ; 
Q) if AVAILABLEQ)=6 /* 著 顶点 v 有 多 余 流 量 ， 但 不 可 流出 * / 
then block v; 
for cach. « uy eE do 
/* 删除 ， 的 前 趋 顶 点 时 ， 把 < uy > 作为 流出 边 * / 
AVAILABLE(u) — AVAILABLE(u) — { < u,v > } 
endfor 
endif 
end. 


$3410.10 RETURN OPERATION 
Procedure RETURN (v, EXCESS(v)) ; 
begin ` 
/* 当 ”是 阻塞 顶点 ， 则 它 的 额外 流量 项 返 回流 入 到 ， 的 顶点 中 * / 
while EXCESS(y) >0 do 
Q=(e = <u,v>,q)< the first flow in STACK(v); 
4 +- minfg, EXCESS(v)] ; 
flej- f(e) - 4; EXCESS(v) - EXCESS(v) — 9’; 
EXCESS(u) — EXCESS(u) + q/; 
if q=q’ then delete Q from STACK(v) 
else Q — (e, g — q^) 
endif 
endwhile 
end. 


有 了 这 两 个 操作 过 程 ， 在 一 个 层次 网 络 上 找 最 大 流 的 并 行 算法 可 简单 地 描述 为 : 


算法 10.11 FINDING MAX. FLOW ALGORITHM 
procedure Max. flow(G, s, t, c, f); 
begin 
(1) parale) do /*L X8 iX E e / 


EXCESS(s)< Y. c(s, v); 


wh, 
PUSH (s, EXCESS(s)) ; 
(2) iel; /A* 脉 冲 计数 * / 
(3) while there exist unbalance vertices in N do 
ie itl; 
for each v: veV pardo 
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if v is unbalanced 
then if y isn't blocked 
then parallel do PUSH(v, EXCESS(v)) 
else parallel do RETURN(», EXCESS(y)) 
endif 
endif 
endfor 
endwhile 

end. 
下 面 的 引 理 展示 了 算法 10.11 的 一 个 有 趣 的 性 质 . ` 
SH 10.6 ”如 果 i 是 偶 (或 奇 ) 数 ， 那 么 在 第 站 个 脉冲 开始 时 ， 所 有 不 平衡 顶点 都 在 奇 《 
或 偶 ) BUR. 
证 明 ”对 i 进行 归纳 ， 当 i= 1 时 ，s 饱和 所 有 射出 边 。 即 第 2 层 顶 点 有 可 能 成 为 不 平衡 
顶点 ， 引 理 成 立 ， 假 设 在 第 i< K) 个 脉冲 开始 时 ， 引 理 成 立 . SPR j= b+ 个 脉 
冲 开始 时 的 情况 。 假 定 在 第 /个 脉冲 开始 时 (不妨 设 /为 偶数 ) 有 一 个 不 平衡 顶点 "位 于 
RUZ. 我 们 证 明 这 是 不 可 能 的 ， 因 /是 偶数 ， 故 /一 1= 是 奇数 。 由 归纳 假设 ， 在 第 / 
一 1 个 脉冲 开始 时 ， 所 有 不 平衡 顶点 都 在 偶数 屋 . 根据 算法 可 知 ， 在 第 /一 工 个 脉冲 时 ， 
所 有 不 平衡 项 点 都 将 额外 流量 尽量 向 前 推进 一 层 〔 即 奇数 层 ) 。 车 有 剩余 的 额外 流量 ， 
出 全 部 向 后 返回 ， 后 一 层 也 是 奇数 层 ， 结果 这 个 非 平 衡 顶 点 的 额外 流量 为 0， 即 变 成 了 平 
衡 顶 点 ， 也 就 是 说 ， 在 第 /一 1 个 脉冲 之 后 第 i 个 脉冲 开始 时 ， 所 有 不 平衡 顶点 都 在 奇数 
HE, ERR. 故 引 理 成 立 。 

应 该 指出 的 是 : 在 一 个 层次 网 络 上 发 现 了 最 大 流 之 后 ， 下 一 步 就 应 构造 一 个 新 的 层 
次 网 络 。 具 体 来 讲 ， 可 分 为 两 阶段 完成 ,第 一 阶段 是 构造 一 个 新 的 网 络 ， 这 个 新 网 络 含 
有 边 e= < wv > 当 且 仅 当 下 列 一 个 条 件 成 立 : 

(1) fle) «c(e), 31 e 的 新 的 容量 c'(e) = cle) — fle): 

Q) f(v,) >0， 边 < vu > 的 新 容量 是 f(e). 

第 二 阶段 ， 从 源 点 s 开始 ， 对 新 的 网 络 执行 宽度 优先 搜索 ， 产 生 一 个 层次 网 络 ， 可 采用 
第 三 章 介绍 的 并 行 宽度 优先 搜索 法 来 实现 . 
3. 算法 的 正确 性 验证 

要 证 明 最 大 流 并 行 算法 10.11 是 正确 的 只 要 证 明 在 每 个 层次 网 络 ， 算 法 [0.11 都 产 
生 一 个 最 大 省 就 足够 了 . 因此 ， 下 面 的 证 明 都 是 基于 层次 网 络 . 
定理 109. (g) 在 层次 网 络 中 ， 至 多 要 2Kz+D 个 脉冲 ， 算 法 10.11 就 会 终止 ; 其 中 【是 网 
HWER. (DAAR 10.11 终止 时 ， 该 算法 产生 一 个 最 大 流 。 

证 明 (a) 因 为 在 经 过 21 个 连续 的 脉冲 后 ， 若 不 存在 阻塞 顶点 ， 则 所 有 顶点 ve V- fs. 28 
外 流量 都 已 分 别 流 人 源 点 s 或 终点 oh. 即 所 有 顶点 都 成 为 平衡 顶点 ， 故 算法 10.11 终 
ik. 


{5) 当 算法 10.10 RIL, SAAR APT. SP = ugur u (=s, m=i) 是 
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任意 一 条 从 s 到 :的 有 向 路 径 ， 我 们 证 明 上 至 少 有 一 条 饱和 边 , 令 uc kcDRE PL 
距离 1 最近 的 一 个 阻塞 顶点 。 则 边 <w, upr1> 是 一 条 饱和 边 。 在 uy 被 阻塞 的 那个 脉冲 ， 
<u, tt1> 一 定 是 饱和 边 。 因 为 un 没有 阻塞 ， 这 条 边 一 直 处 于 信和 状态 。 又 因 
为 wrl 绝 不 阻塞 ， 因 面 也 绝对 没有 返回 的 流量 . 


10.4.3 PS ~- 树 及 其 操作 


在 撒 述 最 大 菠 并 行 算法 的 实现 细节 之 前 ， 我 们 介绍 一 种 PS 一 树 以 及 在 这 种 树 上 的 操 
dE. PS - 树 是 本 节 并 行 算法 使 用 的 主要 数据 结构 。 现 已 证 明 PS - 树 在 栈 、 队 列 以 及 向 量 
维护 方面 非常 有 用 ， 在 并 行 算法 设计 中 ， 它 是 一 种 很 有 前 途 的 工具 , 

BA LEAGUE ap a, cs aV 我 们 把 它 
们 同一 棵 完全 二 叉 树 联系 起 来 ， 这 棵 树 记 为 
Te，am，… ，on 叫 做 PS -- 树 (Partial 
Sums Trees). PS 一 树 有 2 rs 个 叶子。 最 
左 的 个 叶子 称 为 活动 叶子 ， 它 们 分 别 对 应 
a, ay 7 ap HEM PRA O. iEn 
结 点 x 又 是 一 棵 完 金 二 丸 树 T. x 是 T, 的 

图 10.3 PS- 树 示例 (一 思 ) m. 它 的 值 是 GatD 个 元 素 a, ， LE 
Ue oa 之 和 ， 其 中 : a a, sons a, ET, WOE. 图 10.3 显示 了 一 棵 PS 一 树 
T(5, 2, 4, 7, 1, 6. 3). 

下 面 我 们 介绍 PS - 树 上 的 一 些 基 本 
操作 。 ERO 了 是 一 棵 PS - 树 ， 了 的 每 个 结 
点 用 TUO 表示 ， 这 里 有 是 结 点 TIL] 在 
树 中 的 高 讼 (约定 叶子 的 高 度 为 1)，i 是 
结 点 在 同一 高 度 上 其 它 结 点 间 的 顺序 号 ， 
MT) 人 代表 TM. 具体 的 例子 如 图 
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10.4 Bras, Ut) (2.20037 [L4] 05) Cie) [L7] (8) 
为 了 便于 描述 ， 假 定 树 了 的 每 个 叶 


FT] 髓 有 一 个 编号 为 i BSABSERE. 图 10.4 用 高 度 表示 的 PS- 树 示例 
(1) CLEAR 操作 : 
CLEAR(,T) 操作 的 功能 是 : 编号 为 的 处 理 器 将 从 TTL 到 树 根 TUQD)] 路 径 上 
的 所 有 结 点 距 值 为 0， 显然 ， 若 有 多 个 处 理 器 在 同一 棵 树 上 执行 CLEAR 操作 时 ， 则 可 能 
引起 同时 写 "0” 冲 突 。 


算法 10.12 CLEAR ON PS—TREE 
procedure CLEAR(i,T) ; 
begin 
for j— 1 to A(T) do 
TU , i7 287 1-0 
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endfor 
end . 


Q) UPDATE 操作 
在 UPDATE(i, 2,, T) 操作 中 ， 树 的 第 IS FAME a 这 将 引起 其 它 一 些 结 点 
值 的 改变 ， 同 时 可 能 存在 多 个 这 样 的 改变 . 


算法 10.13 UPDATING ON PS 一 TREE 
procedure UPDATE(i, a,, T); 
begin 
(D TJl-e,; 
(2 for j—2 to A(T) do 


TU , i7 27e TU 1,2 (n 727?1 — eru-1,2 (i727 
endfor 
end. 
(3) SUM 操作 


SUM(i, s,,T) 的 功能 是 : s, —a, +a, na, 


算法 10.14 SUMMING ON PS 一 TREE 
procedure SUM(, s,, T); 
begin 
0) s,ca,; 
(2) for js-2 to h(T) do 
i2 0/277 1-. [7/2771 then scs + TU- 1, 7/7207? 1— 1]. endif 
endfor 
end. 


(4) FIND 操作 i 
FIND(s, k, p, T) 的 功能 是 ， 对 给 定 的 x，FIND 返回 上 Rp, (848: 
k-i 
a +a + +a, <a, Xa a, o7 ta, AH p=a~ Ya, 
算法 10.15 FINDING ON PS—TREE 
procedure FIND(a, k, p, T); 
begin 
Q) k-i; pea; 
(2) for j A(T) downto 2 do 
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if p T[j— 1, 2k — 1] 
then p—p— T[j— 1, 2k — 1]; ke2k 
eke kc—2k—1 
endif 
endfor 
end. 


10.4.4 ”最 大 流 算法 的 并 行 实现 


上 一 小 节 我 们 介绍 了 PS 一 树 以 及 它 上 面 的 一 些 基 本 操作 .这 里 将 详细 介绍 最 大 流 算 
法 的 并 行 实现 . 
首先 我 们 介绍 在 实现 最 大 流 算法 时 需 用 到 的 一 些 数据 结构 。 
网 络 的 每 个 顶点 ve V 有 四 种 不 同 的 树 。 它 们 分 别 是 : 
M TOUT): 这 棵 树 有 d。,() 个 活动 叶子， 每 个 叶子 代表 "的 一 条 射出 边 ， 叶子 的 值 
是 射出 边 向 前 推进 《〈 即 从 * 流 出 ) 的 流量 ; 
Q) TING): SBMA 2 x gu(?) 个 活动 时 子 (2" 代 表 脉 冲 数目 )， 它 模拟 STACK() 的 
功能 。 记 录 在 T__IN(Y) 树 中 (从 左 至 右 ) 叶子 上 的 流量 ， 同 它们 在 栈 中 记录 的 次 
序 一 致 ; ` 
T. ACCESS("): RRRA (7) 个 活动 叶子 ， 每 个 叶子 代表 "的 一 条 进入 边 ， 它 协调 
多 个 处 理 器 同时 修改 STACK(v) 的 活动 ; 
T..SUM(y: 这 棵 树 有 4d,,() 个 活动 叶子 ， 每 个 叶子 对 应 v 的 一 条 射出 边 ， 在 某 一 脉 


冲 时 ， 用 它 计 算 返 回 到 "的 流量 总 和 。 
网 络 的 每 条 边 ec E 也 对 应 有 一 棵 PS 一 树 ， 记 作 T__EDGE(e)， 这 棵 树 有 2n (km 
数目 ) 活动 叶子 ， 每 个 叶子 对 应 一 个 脉冲 。 在 某 一 脉冲 时 ， 用 它 计 算 返 回 到 e 上 的 流量 
和 


{3 


E 


4 


E 


要 实现 最 大 流 并 行 算法 ， 关 键 是 PUSH 操作 以 及 RETURN 操作 的 并 行 实 更。 应 该 
注意 的 是 : 在 算法 的 并 行 实现 过 程 中 ， 在 每 个 脉冲 内 ，PUSH 操作 执行 完 之 前 不 能 执 
fi RETURN 操作 。 

BER. GUEST UU ve V 分 派 一 个 处 理 器 PE(y)。 每 条 边 eeE 也 分 派 一 个 处 
理 器 PE(e)， 此 外 ，T__IN(Y) 每 个 叶子 也 分 派 一 个 处 理 器 ， 且 流量 为 Q 的 叶子 处 理 器 记 
Ý PE(Q). ` 

ERNA EZA BIA RPS- 树叶 子 值 为 0. 

车 把 形成 一 个 新 的 层次 网 络 ， 并 找 出 新 的 网 络 上 最 大 流 过 程 称 为 一 个 阶段 ， 则 算 
法 10.16 用 于 每 阶段 的 初始 化 工作 。 


算法 10.16 INITIALIZATION OF MAX — FLOW PROBLEM 
procedure INITIALIZE ; 
begin 
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PECe ,一 «v,w 2) do: 
(1.1) call UPDATE (J,c'(e), T. OUT(); 
(02) f(e)-0; 
PE(v) do: 
(L3) hd())—0; k'(v)-1 
endfor 
end. 


在 算法 10.16 中 ,第 (1.1) 步 的 j 是 v 的 第 7 条 射出 边 ， 即 对 应 T_OUT(y) 的 第 7 个 时 
子 ，% 是 当前 层次 网 络 边 。 上 的 容量 ,第 (1.3) 步 ndf?) 是 栈 STACK (v) HARDEE, BI 
H TIN) 最 右 一 个 有 用 叶子 .Kk 人 (v) 是 存放 在 AVAILABLE(y) 内 边 的 最 小 下 标 ， 
WI k'(v) = minfj | ee AVAILABLE(»)}. 

今后 我 们 用 TIroot] 表示 树 T 的 根 值 ， 即 7[root] 是 TIh(7T),1] 的 值 . 

下 面 我 们 给 出 PUSH 和 RETURN 操作 过 程 的 详细 实现 算法 ， 并 简称 为 PUSH 操作 
H RETURN 操作 ， 现 给 出 PUSH 操作 如 下 : 


算法 10.17 PUSH OPERATION IMPLEMENT 
procedure PUSH(v, EXCESS(v) ; 
begin 
(1) PE(v) do: 
(1.1) «e minfEXCESS(»), T. OUT(v)y[root]) ; 
(1.2) EXCESS(»)«- EXCESS(v) - a ; 
(1.3) call FIND (a, k(v), p, T OUT); 
(2) PE(e, =<vw>) do: 
Q.) if KO) & jsko) / + e,eAVAILABLE(y) * / 
then / + 7 是 树 T_ ACCESS(w) 中 对 应 e 叶子 的 下 标 * / 
(2.1.1) call UPDATE(r, i, T— ACCESS(w)) ; 
(2.1.2) call UPDATE(, 5,, T— ACCESS(w)) ; 
(2.1.3) if jk(v) then q, T - OUTGXIL] else q,—p endif; 
(14) fled fie) *a,; 
(2.1.5) TOTAL(w)«- T. IN(w)froot] ; 
(2.1.6) call UPDATE(hd(w) + $,, q, T. IN(w); 
(2.1.7) call UPDATE(/,T_OUT(v){1, j1— 9, T_OUT(v)) ; 
(2.1.8) hd(w)« hd(w) + T. ACCESS(w)[root] ; 
(2.1.9) call CLEAR(r, T. ACCESS(w)) ; 
(2.1.10). EXCESS(w) — T... IN(w)[root] - TOTAL(w) 
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endif ; 
{3) kijek); 
{4) PE(e, = <u,v>) do: 
if EXCESS(v) >0 
then BLOCK(v) - “yes” ; 
call UPDATE( , 0, T_OUT(u)) 
endif 


end. 


在 算法 10.17 中 ， 第 (1) 25 T_OUT(y) [root] BAM v 应 该 流出 的 流量 . x 是 当前 脉冲 可 
以 流出 的 量 。 第 (1.3) 步 是 处 理 器 PE) RAW e os esu uus omm Ern 流出 的 流量 a, 
其 结果 是 边 eum s eus Lu ERAMA, a RRE p AA eL BI. 
第 (2.1.D~ (2.1.2) 步 是 有 多 个 处 理 器 试图 如 和 流量 到 STACK(w) H. S, 是 处 理 器 PE(e ) 
存 取 STACK (w) 的 顺序 号 ; 第 (2.1.3) (2.1.4) 是 将 ， 的 额外 流量 一 部 分 通过 
Meus ne Eup Mis RAMA qos Tears mm Ia) 7 6i 第 (2.1.5) 
2% TOTAL(w) 是 到 目前 为 止 已 流 人 w 的 流量 总 和 ;第 (2.1.6) 步 的 hd(w) + S, 是 对 应 
流量 (e ,9 ) 的 T_IN(w) 树叶 下 标 ， 这 个 流量 被 记录 在 械 STACK(w) P, E 
树 T__IN(w) 作 适 当 的 修改 以 便 记录 流量 (e ,, o 05 第 (2.1.7) 步 对 。, 的 剩余 容量 进行 修 
改 ; 第 (2.1.8) 步 更 新 栈 顶 指针 ， 在 当前 脉冲 内 ，T__ACCESS(w)[root] 含有 进 
人 STACK (w) 流量 的 个 数 ， 第 (2.1.9) 步 则 清除 TT 一 ACCESS(w) 以 供 下 一 个 脉冲 时 使 
用 ; 第 (2.1.10) 步 重新 计算 w 处 的 额外 流量 .第 (3) 步 表示 AVAILABLE(") 是 目前 剩 下 
的 边 中 的 最 小 下 标 ; 第 00 步 1 是 树 T__OUT(w) 的 第 1 个 叶子 的 下 标 ， 这 个 叶子 的 对 应 
Ae, He, 进 人 一 个 阻塞 顶点 v WR AVAILABLE) EX, e, 必须 删除 掉 。 


现在 我 们 介绍 RETURN 操作 过 程 的 实现 


M, e 


算法 1018 RETURN OPERATION IMPLEMENT 
procedure RETURN(v, EXCESSQO)) ; 
begin 
(1) PE(») do: 
(1.1) call FIND(T. IN(v)root] - EXCESS(»), k(y), p, T..INQ)); 
(1.2) EXCESS(v») - 0; 
(2) PE(Q,-(e,— <u, v>, q) do: 
(2.1) if k(v) « j< hd(v) 
then d "na 
else if ;—k(v) then d,—-q,—P endif 
endif ; 
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(2.2) if k(y)< j< hd(y) 
then call UPDATE(/ ,0, T... IN(v)) 
else if j= k(v) then UPDATE(j, p, T_IN(v)) endif 


endif ; 

if k(v) < j< hd(v) then 
(2.3) call UPDATE (r, d, T. .EDGE(e )); 
(24) fie ) © f(e ) — T. EDGE(e [root] ; 
Q.5 call UPDATE(/,, T. EDGE(e ,)[root], T - SUM(x)) ; 
(2.6) EXCESS(u) — EXCESS(u) + T_SUM(u)[root] ; 
(2.7) call CLEAR(r ,, T. EDGE(e )); 
(2.8) call CLEAR(@,, T_SUM()) 

endif ; 
(3) PE(v) do: hd(v)<—k(v) 


end. 


在 算法 10.18 中 ， 从 v 返回 的 流量 涉及 取消 STACK (v) 里 适当 的 几 个 流量 . 算法 的 
第 (1.1) 步 就 是 确定 还 有 多 少 流量 在 STACKt{v) 中 ， 其 余 的 流量 将 在 第 012) 步 被 删除 
Bis 第 (2.1)~ (2.2) 步 涉及 对 栈 STACK(v) 进行 适当 的 修改 ， 即 从 STACK(v) 中 去 掉 值 
为 EXCESS(v) 的 流量 ; 第 (2.3) 步 的 + ,是 @ ,从 STACK(v) 被 取出 的 那个 时 刻 的 脉冲 ; 
它 也 是 T_EDGE(e ) 树叶 下 标 ， 这 个 叶 的 对 应 脉冲 为 r); T. EDGE(e roo 计算 在 
第 7 个 脉冲 时 ， 边 。, 上 返回 的 流量 总 和 ; 第 (2.4) 步 修改 边 。, 上 的 流量 值 ; 第 (2.5) 2 
的 1 是 T__SUM(w) 中 树叶 的 下 标 ， 它 和 边 。) 相对 应 ; 第 (2.6) 步 更 新 u 的 额外 流量 
值 ,T_SUM(wjlroot] 存 贮 着 当前 脉冲 返回 到 4 的 流量 总 和 ; H (2.7) ~ (2.8) 25 
WR T_EDGE(e,) 及 T_SUM(w)， 以 便 下 一 个 脉冲 到 来 时 使 用 .第 (3) 步 修 
改 STACK(y) 的 栈 顶 指 针 。 

在 每 一 阶段 ， 我 们 还 要 清除 T_OUT(J RT_ING) 内 容 ， 以 便 下 一 阶段 使 用 ， 可 
使 用 下 述 过 程 来 完成 。 


算法 10.19 CLEAN OPERATION 
procedure CLEAN ; 

begin 

(1) for each v: veV pardo 
(2.1) PE(e, = <vjw>) do: call CLEAR(j, T. OUT(v) ; 
(2.2) PE(Q ,= <u>, 4) do: 

if 1<i<hd{v) then cal CLEAR(i T. IN(v)) endif 
endfor 
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end. 


5/58 10.7 在 SIMD — CRCW PRAM 模型 上 ， 算 法 10.17 及 算法 10.18 均 需 O(logn) 
时 间 、O(nm) 处 理 器 . 

证 明 ”算法 10.17 和 10.18 都 是 在 高 度 至 多 为 O(lognm) = O(logn) 的 树 上 进行 操作 ， 显 
ARE 0(ogn) 时 间 ， 在 算法 10.17 中 ， 每 个 顶点 vev TIN RR 2n x d, (9) 个 处 


理 器 。 故 所 有 顶点 的 T_IN 树 需 2n x d, (v) = 2nm. BEER 10.17 需 O(nm) 处 理 器 . 
同样 ， 算 法 10.18 也 需 O(nm) AER. 


10.4.5 ”最 大 流 算法 的 有 效 实现 


上 面 描述 的 最 大 流 算 法 是 一 个 使 用 O (nm) 处 理 器 的 实现 算法 . 本 节 我 们 将 给 出 一 个 
有 效 的 并 行 实现 算法 ， 新 的 算法 通过 对 处 理 器 小 心 合理 地 分 配 ， 得 出 一 个 时 间 复杂 性 相同 
ERE O(n) 处 理 器 的 最 大 流 并 行 算法 ， 

首先 ， 我 们 介绍 Brent 定理 只， 有 效 的 实现 算法 正 是 基于 这 个 定理 的 。 
定理 10.10. .对 任何 一 个 同步 并 行 算法 ， 若 在 个 时 间 内 完成 x 个 基本 操作 步 ， 风 用 p 个 
处 理 器 可 以 在 [x / pl + 个 时 间 步 完成 。 
证 明 ”在 同步 并 行 算法 中 ， 令 x, 表示 在 第 TASER (cic), BI 


+ 


x,~x. 现 有 p 个 处 理 髓 , 对 每 个 时 间 步 完成 的 基本 操作 步 x,, 用 


m 


它们 模拟 时 需 (x, / pl 时 间 步 。 因此， 用 p 个 处 理 器 完成 x 个 基本 操作 步 需 时 间 步 为 : 


X (ix,/ps&XG,/prD« Ix/pl+t 
E ii 


在 给 出 有 效 的 实现 算法 之 前 ， 我 们 分 析 算法 10.17 和 10.18 所 执行 的 基本 操作 步 数 ， 
因为 PUSH 和 RETURN 操作 都 涉及 到 顶点 和 脉冲 序号 i(1 < i< 20) 共有 O(n") 个 基本 操 
作 ， 这 意味 着 在 一 个 层次 网 络 中 找 最 大 流 需 O(n logn) EPRE, MSA O(nm) 处 理 
器 ， 即 每 个 顶点 都 同时 执行 PUSH 及 RETURN 操作 ， 故 在 一 个 晨 次 网 络 中 找 最 大 流 
$ O(nlogn) 时 间 ， 而 求 原 始 网 络 最 大 流 需 构 造 上 个 这 样 的 层次 网 络 . 故 算法 的 基本 操作 
BEA O(n logn)， 时 间 步 数 为 Oln logn). : 

利用 定理 10.10， 我 们 将 给 出 一 个 在 O(n) 处 理 器 上 模拟 算法 10.17 和 10.18 的 并 行 算 
法 ， 但 时 间 复 杂 性 不 变 。 为 此 ， 引 进 T_ASSIGN 树 ， 它 是 一 棵 PS 一 B. T ASSIGN 
有 个 活动 叶子 ， 每 个 叶子 对 应 网 络 的 一 个 顶点 ， 它 将 帮助 我 们 解决 定理 10.10 的 处 理 器 
分 配 问 题 ， 

为 了 执行 任意 顶点 PUSH 操作 或 RETURN 操作 的 一 步 ， 在 执行 之 前 我 们 需要 知道 
所 用 的 处 理 器 数 且 .对 任意 顶点 ver，PUSH 操作 及 RETURN 操作 的 第 (1) 步 和 第 (3) 
步 仅 需 O(1) 处 理 器 ; PUSH 及 RETURN 操作 的 第 (2) 步 分 别 需 (cQ) — k'(v) + 1) PE 
器 和 (hd(v) — k(v) + 1) 个 处 理 器 ; PUSH 操作 第 (4) 2628 06 d, (v) 处 理 器 ; 实现 每 个 阶 
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段 初始 化 的 算法 10.16 和 算法 10.19 所 需要 的 处 理 器 数目 朵 PUSH 操作 及 RETURN 操作 
也 是 一 致 的 . 

F 面 ， 算 法 10.20 RIM T_ASSIGN 树 ， 只 用 n 个 处 理 器 就 可 模拟 它们 。 即 把 算 
法 10.20 分 别 应 用 在 算法 10.16 到 算法 10.19 的 每 一 步 中 。 假 定 处 理 器 及 顶点 的 编号 都 
是 1 到 mn， 还 假定 顶点 /执行 当前 一 步 舌 NG) 个 处 理 器 。 


算法 10.20 SIMULATING ON SIMD MACHINE 
procedure SIMULATE ; 
begin 
(1) for cach j:1< /«z pardo 
(1.1) call CLEAR(j, T. ASSIGN); 
(12) call UPDATE(/, N(j), T. ASSIGN); 
(.) k()-1;  /*x-T. ASSIGN[root] * / 
(1.4) while j+ (k(/) — Dn < T. ASSIGN[root] do 
g,G e i+ GG) - Da; 
call FIND(z ,(), & R, G), T. ASSIGN); 
执行 /的 第 gz(7) 个 处 理 器 当前 步 的 工作 ; 
RUCK) +1 
endwhile 
endfor 
end. 


10.4.6 算法 的 复杂 性 分 析 

为 了 证 明 在 一 个 层次 网 络 中 ， 求 最 大 流 的 并 行 算法 只 需 2n 个 脉冲 就 可 终止 ， 首 先 我 
们 证 明 一 些 引 理 ， 为 叙述 方便 ， 我 们 定义 一 个 所 谓 合法 的 三 元 组 (e= cur» i i). 
BEE THE O = (e) ER i, 个 脉 串 时 ， 它 通过 边 。 HA "， 且 记录 在 STACK) 
H. 但 在 第 i 个 脉冲 时 ， 某 个 返回 到 v 的 流量 引起 O 的 改变 0 O 位 于 STACK Q) 的 
RDE) . 由 引 理 10.6 可 知 ， 著 (e 4, 4j) 是 一 个 合法 的 三 元 组 ， 那 么 i, 为 奇数 当 且 
dU i 为 偶数 。 . 
5]8 10.8 设 (e = «wv, i, i,) 是 一 个 合法 的 三 元 组 且 i, <i<i,， 那 么 存在 一 硕 
Sw RENE I. ine KE (o, m vw s. dus d, ) 是 一 个 合法 的 三 元 组 且 


i, sisi 
p» r 


n 
证 明 ”假设 存在 一 个 i HEB i, <i, i. (ASTRA. Oi, REG v 阻塞 的 脉 串 
WS. i, <i, Si, RATS. 

情形 1: i, Bi 


a7 "s 
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情形 1: i, i, 

BH i, 满足 i <i, ci. HUG, 一 i, > 1， 这 说 明 在 第 i, 个 脉冲 时 ， 从 ， 返 回 的 某 
个 流量 改变 了 STACK (v) 的 一 个 流量 Q， 而 Q 是 在 第 i, 一 1 个 脉冲 之 前 推 人 STACKQ) 
的 .这 意 球 着 在 第 i, ~ 1 个 脉冲 时 ， 有 某 个 流 返回 到 »*， 因 此 的 确 存在 一 个 三 
TH (<v,w>, i, i, — 1). 在 第 i, 个 脉 溃 时 ， 某 个 流量 从 v 流出 且 I < i， 因此 i 
si <i,—1, PEFR. 
情形 2: i, <i, 

TOXCRMEDE E, EW i, 个 脉冲 结束 之 前 ， 任 何 流入，* 的 流量 不 能 从 v 返回 。 因此， 
从 v 返回 的 总 流量 不 超过 在 第 i, 个 脉冲 之 后 流入 "的 总 流量 ， 这 与 存在 一 个 三 
元 组 (< v», ip L) FE. 

4 q 是 某 一 时 钟 脉冲 i, 时 流 人 ， 的 流量 i si ER i, + 1 个 脉冲 时 ， 这 个 流 
量 4 从 v 流 出 . Ge, 是 9 的 流出 边 . 若 不 存在 合法 的 三 元 组 (e ,5 + 14), WER i, 
+ 1 个 脉冲 时 ， 通 过 。, 的 流量 再 不 会 返回 ， 如 果 存 在 一 个 这 样 的 三 元 组 ， 那 么 ja <i, 
< 已 一 1 因此， 这 个 三 元 组 对 应 的 流量 再 也 不 会 从 "返回 。 这 意味 着 存在 几 条 边 ， 在 
第 忆 + 1 个 脉冲 时 ， 这 个 流量 9 从 ”流出 且 是 通过 这 几 条 边 流出 的 ， 网 上 上面 的 讨论 一 
样 ， 在 这 个 脉冲 中 通过 这 几 条 边 的 任何 流量 或 考 根本 不 会 返回 、 或 者 在 第 is 个 脉冲 之 前 
返回 到 v 并 重新 寻找 路 径流 出 . 

引 理 109 Hv, vy m v, REL, Bk NEERA 
(eT <4, v, b i» m, (e, = xu, i, i 
是 合法 的 三 元 组 ， 令 
A, 一 fa | a 是 偶数 且 i, <a<i,, 对 某 个 1<d<k}, 
那么 ， 在 算法 终止 时 第 j 层 L DEM ARE l4 b Asie 1-0. 
证 明 k=l- p RTA. kin, j-K0-1. 由 于 工 ， 是 最 接近 于 1 的 一 
层 ， 在 某 个 脉冲 时 推 人 此 层 的 流量 或 者 在 下 一 个 脉冲 返回 , 或 者 根 本 就 不 返回 , 因 


th i， 一 i 十 1，1<5<k， 即 是 说 14 ISk. RMAF», "o v, 都 有 流量 返回 ， 
所 以 它们 才 都 是 阻塞 的 . 
假定 引 理 对 L a 成 立 ， 现 证 明 它 对 工 ， 也 成 立 . Bv, ce v, ÉL, Wk HIEGE 


顶点 ， 且 (< v mi dud, (< v > d, s ) 是 合法 的 三 元 组 ,根据 
引 理 10.8， 在 工 ,+t 存在 8 (8 WE) TREO w, w, 1 w, 和 合法 的 三 元 组 


ff awe For 
Gv, ru mL m Gs ws P, ) EIUS 
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Un, +1i, «nc Ür,. gy 
因此 ，M4 [+k 214 l 
实际 上 ， 有 可 能 存在 多 个 三 元 组 进入 一 个 已 知 顶点 we fw, ms w}. 然而， 
Bl<v,w>,i,i)R(<v,, W>, Vp r 都 是 合法 的 三 元 组 ， 那 么 栈 STACK(w}) 
i RAAR UPAR. ils, ifb RE, i150, i). 因此 对 每 
个 w， 选 择 了 最 大 区 间 ， 由 归纳 假设 ， 到 算法 终止 时 ， 在 工 , EEDA M, nl THER 
Fo ja +1 <s<it), ETISEBIEDGA L, 里 至 少 还 有 |4 | PASIR J, </ 
<i 
定理 10.11 ”在 层次 网 络 中 ， 算 法 10.11 至 多 需 ln 个 脉冲 ， 算 法 将 终止 - 
证 明 ”假定 算法 10.11 在 经 过 2n 个 脉冲 之 后 仍 不 终止 ， 那 么 ， 在 2n 个 脉冲 后 ， 网 络 中 
至 少 还 存在 一 个 不 平衡 顶点 v。 令 E 是 这 样 一 些 边 e 的 集合 。 在 经 过 In 个 脉冲 后 ，e BE 
不 是 饱和 边 又 不 是 进入 到 一 个 阻塞 顶点 的 进入 边 。 通 过 对 每 条 边 eeE' 赋 新 的 容量 
e'(e) = fle) 来 修改 层次 网 络 .算法 10.11 在 修改 后 的 网 络 上 、 同 它 在 原来 网 络 上 同样 地 
执行 ， 直 至 第 2n 个 脉冲 结束 。 然 而 ， 在 修改 后 的 网 络 中 所 有 额外 流量 将 返回 到 s， 这 是 
不 可 能 的 。 假 定 在 第 i 个 脉冲 (i > 27) 时 ， 一 个 流量 从 za 返回 到 s. 因而 存在 一 个 合法 的 
三 元 组 (< su > Li), BH 10.9、 阻 塞 的 顶点 数 > 14, > mn， 产生 了 矛盾。 
定理 10.12 在 SIMD — CRCW PRAM 上 ， 计 算 一 个 网 络 N — (G, s, 4 c) 的 最 大 流 算 
法 ， 需 O(n logo) 时 间 、O(n) 处 理 器 . 
证 明 ”并 行 算法 10.11 有 x = O(n logi) 个 基本 操作 步 ， 时 间 步 := O(n togn). 应 用 定 
理 10.11 知 ， 可 使 用 O(n) 个 处 理 吕 模拟， 模拟 时 间 为 : O( [x / pl + 2) = O(n7logn), 


10.5 最 大 流 问题 的 分 布 式 算法 


Cheung 基于 著名 的 Ford — Fulkerson 算法 ， 用 第 三 章 的 深度 优先 搜索 技术 对 最 大 
流 问 题 建议 了 一 个 分 布 式 算法 ”。 本 节 将 介绍 这 个 算法 ， 


10.5.1 最 大 流 问题 的 一 些 基本 概念 


4 a(u) B(w) 分 别 表示 顶点 weV 的 射 人 边 集 合 和 射出 边 集合 ， 不 失 一 般 性 ， 假 定 边 
«uy-6eE, BA<vu>rek, HB «vu AE ARH 0. G uv — c(u)- f(uv)* f 
(yu) EU «uy» RU «vui <u,y>F É 893: Ob EE (Throug put Capacity), 3S 
(uv) 0, My BA u 可 达 的 . 车 (uv) 0, XL cuv 是 一 条 饱和 边 ， 
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根据 当前 的 流 A 我 们 定义 标号 过 程 及 扫描 (Scanning) 过 程 如 下 : 所 谓 标 
号 (Labeling) 一 个 顶点 we， 是 指 赋予 ， 一 个 二 元 组 (w,s)， 其 中 顶点 4 是 将 它 当 前 的 流 
BAA v, 表示 从 源 点 * 出 发 经 过 "通过 边 < wy > 的 最 大 流量 。 所谓 扫 描 (Scanning) 
一 个 顶点 w， 是 指 尚未 标 导 的 w 对 一 些 顶点 或 对 所 有 顶点 进行 标号 ， 这 些 项 点 都 是 w 的 后 
继 顶 点 ， 仅 当 标 号 过 的 顶点 才 有 可 能 成 为 扫描 顶点 。 

Ford — Fulkerson 算法 是 一 个 选 代 过 程 、 根 据 当前 的 流 每 次 迭代 开始 时 ， 首 先 给 
源 点 * 标号 (s*, 0)， 然 后 ， 某 个 标号 顶点 就 试图 扫描 和 标号 其 它 顶点 ， 直 至 出 现下 列 某 
一 种 情形 后 才 终止 目前 的 标号 过 程 : 

(终点 1 被 标号 。 此 时 ， 找 到 一 条 增 广 路 径 了， 对 路 径 了 上 所 有 边 < u,v > 的 流 
E Suv) 增加 一 个 流量 D 其 中 Sm = min{d(u,v) uy 是 了 上 的 边 }。 然后 废弃 
所 有 顶点 的 标号 ， 从 源 点 s 开始 进入 下 一 次 选 代 . 

(i) 除 终点 ! 未 标号 外 ， 所 有 标号 顶点 均 已 扫描 过 。 在 这 种 情况 下 ， 当 前 流 了 即 为 
最 大 流 ， 算 法 终止 执行 。 

在 串 行 算法 中 ， 每 次 先 代 结束 时 ， 必 须 废弃 上 一 次 选 代 时 的 标 导 . 然而， 在 分 布 式 
计算 环境 里 ， 若 不 能 在 每 次 和 迭代 结束 后 废弃 顶点 标号 ， 将 造成 不 同 选 代 之 间 标 号 的 二 义 
性 、 为 了 消除 标号 的 二 义 性 ， 在 每 次 选 代 后 可 广播 一 消除 标号 的 消息 ， 显 然 这 样 会 增加 
系统 的 开销 。 为 避免 这 种 开销 ， 我 们 将 每 次 选 代 序 号 也 包括 在 所 有 标号 消息 中 广播 - 

在 给 出 分 布 式 算法 之 前 ， 我 们 约定 一 些 记 号 如 下 : 

(1) R, 表 示 顶 点 + 的 当前 流 可 达 的 顶点 集 . BIR, = [vie rv» EEH) > 01. 

Q) 工 ,表示 本 次 选 代 过 程 PRR SABAL AMR. HL CR. 

(3 P= fd, u, v, t; e) 表示 流量 增 广 路 径 的 一 部 分 ， 它 由 顶点 路 u, s v t 

组 成 ， 且 通过 忆 的 最 大 流量 为 6。 
(4) (path;P) 表 示 一 个 路 径 消 息 ,， 它 通知 接收 者 r， 增 广 路 径 已 扩充 到 +， 即 
Pe Pufrh, 


10.52 深度 优先 搜索 的 最 大 流 问 题 的 分 布 式 算法 


算法 10.21 FINDING MAX — FLOW USING DFS TECHNIQUE 

输入 : 每 个 结 点 reF 的 邻居 集 N | = Br» e£) 及 容量 集 c(r,u)， 对 每 个 LeN,; 

输出 : 源 点 s 存放 着 最 大 流 中 各 条 流 的 增 广 路 径 。 

/ * 算法 开始 时 ， 从 源 点 s 开 始 用 第 三 章 的 分 布 式 深度 优先 搜索 算法 遍历 图 G(V,E)。 
每 个 遍历 过 的 顶点 被 标号 为 (0,0,0)， 同 时 醒 6(r, u) clu) VueN,. R, 
二 {vbeN,and élr, y»0).*/ 

begin 
HR s 处 的 算法 : 
iel; Z+ ERRAT / 
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send (label, i, s,E) message to v, veR,, r—max {d(s, v) | veR,} ; 
upon receiving (label, i, d, £) from node d do: 

if i=, then send (echo, s) to d endif; / * echo 是 应 答 消息 * / 
upon receiving (echo, d) from node d do: The algorithm terminates. 
upon receiving (path; P) from d do: 

Pefs}uP; 

o(s, d) öls, d) — 2; 

if d(s,d)=0 then R, — R, — (d) endif; 

Store P in node s; 

if Rz theni <i 1; 


L eR; 
select veL, ; 
L —-L, —{v}; 


send (label, is, ó(s,v)) to v 
else The algorithm terminates 
endif ; 
终点 rb GAS | 
/ * 一 旦 从 vy 收 到 (label, i, d, c) E. a AE ME * / 
upon receiving (label, i, d, 2) from d do: 
Pcít;d; 
Send (path; P) to d; 
HER r( #8, OR AGE: 
7 * 结 点 + 已 标号 为 (1,，, 下 ，8,)， 这 个 三 元 组 表示 在 第 i, 次 选 代 时 ，r 标号 为 i， 
其 父 结 点 是 已 ， BREE + / 
upon receiving (label, i, d, £) message from node d do: 
if i-i /A * 在 本 次 选 代 时 了 已 标号 过 * / 
then send (echo, r} message to d / * 拒绝 标号 请 来 * / 
else if i>i, / * HERREN ARE / 
then F, ed; 
L,-L,~{d}; 
G, F.:)—G d, 5; 
if L, 一 中 
then send (echo, r) to d 
else select veL; 
L cL 一 人 
send (label, i, r, a) to v, «= minfe,ô{r,v)} 
endif 
endif 
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endif ; 
upon receiving (echo, d) from node d do: 
fL =b 
then send(echo, r) message to father F, 
else select veL; 
L eL, =p}; 
send(label, i, r,a) to v, a= minízó(r,v)] 
endif ; 
upon receiving (path; P) from node d do: 
Pe{rhuP; 
é(r, d) —ó(r, d)—2; 
if (n, d) — 0 then R, — R, — {d} endif; 
é(r, F)có(r, F)tt; 
R, oR VIF Y i 
send (path; P) to F, 
end. 


定理 10.13 ”在 基于 异步 通信 的 分 布 式 计算 模型 上 ， 计 算 一 个 有 向 网 络 = (G, s, 1, c) 的 
最 大 流 ， 若 c 为 EI* 函数 ， 且 最 大 流 值 为 六 ， 则 算法 10.21 的 通信 复杂 人 性 
为 Dr 广 ). 

证 明 ”在 深度 优先 搜索 过 程 中 ， 每 次 迭代 的 标号 过 程 .终止 于 终点 被 标号 。 在 最 坏 情 
况 下 有 两 种 情形 出 现 ， 其 一 ， 仅 在 网 络 的 其 它 所 有 顶点 标号 后 才 标 号 终点 ; HO. EA 
项 点 r(s 除外 ) 仅 在 对 所 有 邻居 试图 标号 之 后 才 标 号 成 功 。 上 述 第 二 种 情形 需 LE. LAS 
号 消息 和 |E,| 一 1 条 应 答 消息 ， 这 里 |E,| 是 1 的 非 父 缚 点 的 邻居 数目 ， 由 于 流量 增 广 路 径 


需 1PI 一 1 条 路 径 消息 ， 故 每 次 迭代 需 通信 复杂 人 性 为 Y, QIE,I- D (Vi—1)= 0m) 
rev -tna 


又 车 边 的 容量 为 整数 ，Edmonds A" 已 证 明 ， 这 需 广 KER. 故 使 用 深度 优先 搜索 
技术 设计 的 最 大 流 问题 分 布 式 算法 的 通信 复杂 性 为 Om f). 

Cheung 还 给 出 了 使 用 最 大 增 重 (Largest, Augmentation) 搜索 技术 以 及 宽度 优先 搜索 
技术 的 最 大 流 分 布 式 算法 ， 同 上 面 的 算法 基本 上 是 类 似 的 ， 这 里 就 不 再 介绍 了 


10.6 小 结 


本 章 重点 介绍 了 网 络 流 图 问题 一 一 AOE 网 及 最 大 流 的 并 行 算法 ， 主 要 内 容 包括 : 
基于 共享 存 贮 模型 ， 介 绍 了 AOE 网 的 存在 性 测试 、 拓 扑 排序 以 及 求 关键 路 径 的 并 行 算 
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法 ; 基于 超 立 方 及 洗 牌 互连网 络 模型 ， 介 绍 了 拓扑 排序 以 及 求 关键 路 径 的 算法 ; 基于 异步 
通信 的 分 布 式 计算 模型 ， 讨 论 了 求 关键 路 径 的 分 布 式 算法 。 在 最 大 流 问题 的 并 行 算法 中 ， 
给 出 了 一 个 有 效 的 实现 算法 . 最后， 在 分 布 式 计算 模型 上 ， 利 用 深度 优先 搜索 技术 ， 介 
绍 了 一 个 求 最 大 流 的 分 布 式 算法 ， 

Bh. Goldberg 等 人 基于 一 种 标号 法 给 出 了 最 大 流 的 另外 一 个 分 布 式 算法 ， 该 算法 
的 通信 复杂 性 是 Onm), WEIL O(n"). 

关于 最 大 流 问 题 的 并 行 算法 ，Johnson 曾 基于 SIMD—CREW PRAM， 给 出 了 平面 
图 的 最 大 流 算法 .他 的 算法 需 O(log’n) fil. O(n‘) 处 理 器 或 Otiog?m 时 间 ，O(n“) 处 
mg" BOR. Goldberg 等 人 基于 SIMD — EREW PRAM， 对 一 般 图 给 出 了 一 
^ O(n'logn) Hi. O(n) 处 理 器 的 最 大 流 算 法 .另外 作者 基于 SIMD 
-CREW PRAM, X} AOE 网 的 存在 性 测试 ， 拓 扑 排序 以 及 关键 路 径 的 计算 ， 曾 建议 了 


更 简单 的 并 行 算法 “， 且 在 时 间 复 杂 性 不 变 的 情况 下 处 理 器 数目 路 有 减少 、 
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第 十 一 章 ” 极 大 独立 集 的 并 行 算法 


11.1 引 言 


近 玫 年 来 ， 图 的 极 大 独立 集 问题 的 并 行 算法 研究 ， 已 经 取得 许多 令 人 鼓舞 的 成 果 。 
人 们 之 所 以 热 训 于 这 一 问题 的 并 行 算法 的 研究 ， 至 少 有 两 方面 的 原因 ;其 一 是 它 有 广泛 
的 应 用 背景 ， 图 的 极 大 独立 集 问题 可 归 约 为 最 大 约束 装 箱 、 最 大 匹配 以 及 图 的 最 大 着 色 
等 调度 问题 "5; 其 二 是 一 般 图 的 家 大 独立 集 问题 的 求解 算法 本 质 上 是 硕 序 的， 若 将 其 移 
植 修改 成 并 行 算法 ， 则 效率 很 你， 因而 从 这 一 问题 本 身 出 发 ， 探 索 其 并 行 性 是 刺激 人 们 
对 其 进行 研究 的 另 一 动机 。 

在 本 章 中 ， 我 们 将 介绍 几 个 极 大 独立 集 问题 的 并 行 算 法 .首先 将 叙述 简单 的 并 行 算 
法 和 基本 概念 ， 然 后 再 讨论 有 效 的 并 行 算法 .因为 有 的 算法 引进 了 随机 性 ， 所 以 下 一 节 
讨论 概率 算法 的 基本 知识 ， 


11.2 概率 算法 的 基本 概念 


在 分 析 算 法 时 ， 和 通常 分 别 考虑 算法 的 最 坏 情况 复杂 性 和 平均 情况 复杂 性 。 这 对 研究 
算法 的 性 能 ， 对 许多 问题 是 合适 的 ， 但 也 有 不 少 问 题 不 尽 人 意 。 尤其 是 有 的 问题 个 别 实例 
求解 需要 很 长 的 计算 时 间 ， 而 求解 此 问题 的 平均 时 间 〈 又 称 期 望 时 间 ) ， 与 最 坏 时 间 相 
比 ， 却 要 小 得 多 ， 在 这 种 情况 下 ， 油 者 之 间 的 差别 就 相当 悬殊 ， 从 实用 角度 出 发 ， 如 果 要 
求解 的 一 个 问题 包含 有 众多 的 实例 ， 那 么 最 坏 情 况 的 时 间 复 杂 人 性 就 难以 测度 算法 的 优 劣 ， 
而 平均 时 间 却 能 成 为 衡量 算法 好 坏 的 一 个 比较 合理 的 标准 。 为 此 ， 人 们 就 试图 研究 出 一 些 
平均 时 间 复 杂 人性 较 好 的 算法 。 但 是 ， 要 分 析 一 个 算法 的 平均 复杂 性 ， 需 对 输入 数据 的 分 布 
做 出 假设 ， 如 排序 n 个 数 的 问题 ， 一 般 假定 输入 的 数据 是 均匀 分 布 的 ， 即 个 数据 中 的 每 
一 个 ， 在 = 个 位 置 上 出 现 的 构 率 是 等 同 的 ， 然 而 遗 皋 的 是 : 有 许多 计算 问题 的 数据 分 布 
要么 是 无 法 预先 知道 ， 要 么 是 随时 间 的 变化 而 变化 ， 因 而 也 就 无 法 对 其 分 布 作出 合理 的 假 
设 。 为 了 加 免 这 种 困难 ， 人 们 试图 对 输入 数据 的 概率 分 布 不 作 任何 假设 ， 完 全 任 其 “ 自 
然 ”地 分 布 ， 但 在 算法 的 内 部 引入 随机 住 ， 从 而 可 望 得 到 一 个 平均 时 间 较 短 、 较 实用 的 算 
法 ， 这 就 是 所 谓 的 概率 算法 ， 或 称 随机 算法 。 

假设 是 一 个 待 计算 的 问题 ， 如 果 P 中 的 每 个 计算 任务 称 为 的 一 个 实例 ， 那 么 忆 
本 身 就 是 这 些 计算 任务 的 总 和 . 例如， 排序 问题 ， 就 是 汇集 了 所 有 的 元 组 7 
= (xi，x "xs)， 即 全 体 实例 。 对 于 一 个 给 定 实例 1， 其 任务 就 是 产生 菜 个 置换 x 
是 1, 2 …-, n} 的 一 个 枚 举 ， 使 得 xn < x Se Sa. BRED HET SERIO 
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如 果 我 们 要 研究 某 个 问题 P 的 复杂 性 ， 那 么 总 要 涉及 到 它 的 实例 Te P 的 规模 四。 通 
Je. € 吓 与 其 所 需 的 关键 操作 多 少 、 或 所 占用 的 存 贮 空间 多 少 、 或 所 需 的 消息 基 大 小 联 
系 在 一 起 。 因 此 ， 对 于 一 个 元 组 (x,,x,,*…, x,)， 一 般 就 假定 其 规模 为 x。 一 个 具有 
个 顶点 、m 条 边 的 《有 疝 或 无 向 ) 图 G， 它 的 规模 1G| 定义 为 n+ m。 一 个 整数 的 规 
模 In| 定 义 为 二 进 制 表示 n 时 所 需 的 位 数 ， 即 ml = Togri. 

设 卫 表示 一 个 计算 问题 ，P 的 一 个 概率 算法 (Probability Algorithm) PA 定义 为 : 
令 I 是 的 一 个 实例 ，IeP，|1|=n， 在 用 PA 解决 的 过 程 中 ， 在 它 的 某 些 确定 的 步 又 
上 ， 随 机 地 选取 一 个 整数 5，1 < b <n, Hb 表示 选取 的 第 i 个 元 素 ， 用 + ==(b,,…, 5,) 
表示 整个 过 程 中 所 选 出 的 随机 序列 。 算 法 PA 除了 这 些 选取 步 台 外 ， 其 它 步 怠 都 是 完全 确 
定 的 ， 

车 对 每 个 TeP，|1|= n. AA PA 解决 了 所 需 的 平均 时 间 小 于 或 等 于 fn), WR PA 
在 期 望 时 间 f(n) 内 解决 问题 P。 所谓 期 望 时 间 ， 就 是 用 PA 解决 所 有 了 及 用 时 间 的 平均 
数 ， 该 平均 数 是 对 所 有 可 能 的 选择 序列 > 而 言 的 ， 且 所 有 的 序列 r 有 相 岂 的 概率 ， 

关于 概率 算法 ， 存 在 几 种 不 同 理解 。 事 实 上 ， 在 上 面 叙述 中 ， 我 们 称 PA 在 期 望 时 
间 f(a) 内 解决 问题 P， 并 不 意味 着 对 实例 Te P. =n, PA 均 能 在 时 间 f(n) 内 结束 ， 
或 者 说 在 时 间 f(n) 内 结束 且 给 出 正确 的 结果 。 换 句 话说 ，PA 在 最 坏 情况 下 的 运行 时 间 ， 
可 能 远 远 大 于 f(x)， 只 不 过 发 生 这 种 情况 的 概率 很 小 。 因 此 导致 对 概率 算法 的 两 种 不 同 
理解 方式 : 

第 一 种 观点 认为 : PA 偶尔 产生 一 个 不 正确 的 解 ， 但 总 能 在 期 望 的 时 间 内 结束 。 
设 PA 为 某 一 概率 算法 ， 它 对 于 了 的 某 些 实例 了 及 其 选择 z， 可 能 产生 一 个 不 正确 的 解 . 
令 0<z<1. 如 果 对 任何 一 个 TeP，PA 在 期 望 时 间 产生 一 个 不 正确 解 的 概率 小 于 zs， 那 
ABATE PA 解决 问题 P 的 概率 大 于 1 - es。 换 句 话说 ， 对 于 实例 [， 导 致 PA 产生 一 个 不 
正确 解 的 选择 序列 r 的 概率 小 于 e 

第 二 种 观点 认为 :PA 总 能 得 到 正确 的 解 只 不 过 其 运行 时 间 可 能 很 大 ， 甚 至 无 穷 . 我 
们 可 以 对 第 一 种 观点 作 适 当 的 修改 ， 即 人 允许 选择 序列 r 的 长 度 可 以 是 无 穷 的 。 如 果 r 的 长 
度 超 过 m 的 概率 为 POL m). ELS m HEBR. PQm) 尽快 的 趋向 于 0， 那 么 用 算法 PA 计 
算 实 例 了 最 终 能 结束 的 概率 为 o BIRA MKAA. 

针对 上 面 两 种 不 同 的 观点 ， 为 了 保持 叙述 的 准确 性 ， 在 提 到 算法 PA 解决 某 一 问题 忆 
时 ， 我 们 总 称 PA 能 在 /(m) 时 间 内 结束 生得 出 正确 解 的 概率 大 于 1— s， 这 里 是 满足 0 
所 <1 的 一 个 任意 小 的 正 数 。 

实际 上 ， 求 解 一 个 问题 所 用 的 时 间 方 差 也 具有 很 重要 的 意义 .因为 它 能 度量 随机 变 
量 与 其 平均 值 的 偏离 程度 - 

在 以 后 的 讨论 中 ， 约 定 P(E,) 表示 随机 事件 已。 发 生 的 概率 ; EQ) 表示 随机 变量 
的 数学 期 望 ; off) 表示 随机 变量 的 方差 ， 且 方差 和 数学 期 望 的 关系 是 : 

oO = EE — B®)" 
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11.3 极 大 独立 集 问 题 的 简单 并 行 算法 


11.3.1. 极 大 独立 集 问题 的 基本 知识 

B G(V,E) 是 一 个 无 向 图 ， 对 任意 一 个 顶点 子 集 5SV， 令 N(S) 是 S 的 邻居 集 ， 定 
义 N(S)= {wl 存在 一 个 ueS 且 (wu,w)eE}. 车 SNN(S)= 中 ， 则 5 是 G 的 一 个 独立 
集 (Independent Set) 也 就 是 说 ， 在 S 中 任何 两 个 顶点 都 没有 边关 联 。 若 S 不 含 任 何 这 样 
一 个 真子 集 8 ， 且 3 也 是 一 个 独立 集 ， 则 独立 集 8 称 为 极 大 独立 
$Æ (Maximal Independent Set， 简 记 为 MIS). HAWN, Æ SAN(S)=o6 A SUN(S) 
=7Y， 则 8SsP 是 极 大 独立 集 ， 在 图 11.1 中 ， 图 (a) 是 一 个 独立 集 的 例子 ，5 
= (1h NG) = {2,3,4,5,6}; 图 (5) 是 一 个 极 大 独立 集 的 例子 ，S = {3,6}. N(S) 
= f1,2,4,5}。 值 得 注意 的 是 ， 极 大 独立 集 可 能 不 唯一 ， 例 如 图 11.105) 中 ， 除 了 {3,6} 是 
BRM, (3,51. {2,4}, {2,5}. {4,6} 都 是 该 图 的 极 大 独立 集 . 


2 z 


5 5 
4 4 


() 一 个 独立 集 (一 个 极 大 独立 集 
图 11.1 独立 集 和 极 大 独立 集 示 例 
设 G(V,E) 是 一 个 无 向 图 ， 了 = (1,2, n, nn}， 计 算 G 的 极 大 独立 集 了 的 申 行 算法 非常 
简单 ， 描 述 如 下 : 


算法 11.1 FINDING MIS (SISD) 
输入 : BIG(V EY Ap HAE ME A; 
输出 : G 的 一 个 极 大 独立 集 IS V。 
begin 
(D fed ND; / * XR KE Redon m7 
(2) for i 1 to n do ` 
if ig NCD then 1 — Iofil; 
ND ND IG) = 1E 
endif 
endfor 
end, 
这 个 算法 输出 的 极 大 独立 集 I 称 为 字典 序 优先 的 极 大 独立 集 (Lexicographically 
First Maximal Independent Seb， 记 作 LFMIS， 显 然 它 的 时 间 复 杂 性 为 Ol). 
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尽管 解决 MIS 问题 的 串 行 算法 非常 简单 ， 但 求解 这 个 问题 并 行 算 法 却 难得 
£. Valiant” 曾 注意 到 MIS 问题 很 可 能 是 那 一 类 不 存在 快速 并 行 算法 的 问题 ， 后 
来 Cook 证 明 : 在 并 行 计算 模型 上 ， 不 存在 一 个 时 间 复 杂 性 为 Oog" n)、 处 理 器 数 
为 O(n“) 的 LFMIS ITAR", RE c, Me, 是 大 于 0 的 常数 . 

因此 ， 为 了 设计 一 个 MIS 问题 的 并 行 算法 ， 需 要 采用 同 串 行 算法 完全 不 同 的 设计 策 
Me. Karp 等 人 发 展 了 一 种 称 为 迭代 改进 的 设计 策略 ， 首 次 给 出 一 个 快速 地 求解 MIS 问题 
的 并 行 算法 。 下 面 我 们 介绍 他 们 算法 的 梗概 . 


11.5.2. 极 大 独立 集 问题 并 行 算法 的 高 层 描述 
目前 几乎 所 有 的 MIS 并 行 算法 都 遵循 Karp 等 人 描述 的 框架 结构 ， 设 G(Y,E) 是 一 
个 无 向 图 . 4 G = (V'EN) 是 G 的 一 个 子 图 ,对 所 有 的 W e V^, BE W EG 中 的 
BER N(W) 为 : 
N(W) = (i | ie VBE SMR GN EY 
算法 描述 如 下 : 


算法 11.2 FINDING MIS IN PARALLEL 

输入 : 无 向 图 G(V,E); 

输出 : G 的 一 个 极 大 独立 集 7 7E VV。 

begin 

(0 Ieg; GOVE) - GE) ; 

(2 while G’# do 
(2.1) select a set J^ € V’ which is independent in G’; 
(22) I-or; 
(2.3) Ye PUNT); 
(24) G'-(V',E') is the induced subgraph on V/— Y 
endwhile 

end. 


在 算法 102 的 执行 过 程 中 ， 新 的 子 图 G^ 的 顶点 集 V^. ARG NO) 三 者 之 间 的 关 

系 ， 满 足 条 件 : à 
INNDAV' =b 和 TONDO =V 

当 算 法 终止 时 ， 有 G'— d. 按照 极 大 独立 集 的 定义 ， 这 时 候 的 了 即 是 G 的 极 大 独立 
fe. 算法 11.2 的 关键 在 第 {2.1) 步 ， 若 使 用 Om) 处 理 器 ， 一 旦 选 出 了 了 ， 则 了 及 G REA 
易 在 O(log^n) 时 间 内 修改 完毕 。 还 可 证 明 : 在 SIMD - EREW PRAM 上 ， 在 期 望 时 
间 (log^n 内 可 选 出 1， 且 

WON) = A044) loglV') 

定理 11.1 YE SIMD — EREW PRAM E, 计算 MIS 问题 的 随机 并 行 算法 11.2， 需 期 
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38 O(log'n) 时 间 、O(n”) 处 理 大 ;而 它 的 确定 算法 版 本 需 OCog n) BY, O(n’ /log’n) 
处 理 器 . 
证 明 ” 见 Karp 等 人 文章 "。 

EF Karp 算法 的 复杂 性 分 析 非 常 复杂 ， 这 里 不 打算 进一步 详细 地 介绍 他 们 的 算法 . 
下 面 先 介绍 Luby 建议 的 两 个 简单 的 随机 并 行 算法 ， 然 后 叙述 把 一 个 随机 算法 转换 成 一 
个 确定 算法 的 基本 技术 ， 并 给 出 一 个 确定 的 MIS 并 行 算法 


11.3.3. 极 大 独立 集 问题 的 随机 并 行 算法 

Luby 建议 的 两 个 简单 的 MIS 随机 并 行 算法 ， 也 如 循 上 面 描述 的 框架 结构 ， 严 格 
地 讲 ， 各 种 不 同 的 MIS 并 行 算法 的 主要 区 别 ， 仅 仅 体现 在 选择 步 第 Q.D 步 的 设计 上 。 设 
HE DIR PR AR ER 

1 在 并 行 计算 模型 上 ， 选 择 步 的 执行 时 间 应 当 非 常 短 ; 

2) 在 G' 成 为 空 集 之 前 ， 整 个 while 循 环 体 的 执行 次 数 ， 应 该 非常 的 少 

首先 我 们 介绍 一 个 极其 简单 的 MIS MOLAR. KROME. BUE VI 
= [1, 2:0}. SBA ie V^, REX adii) = {7 |} eY' H (ij )eE 


算法 11.3 SIMPLE RANDOMIZED PARALLEL ALGORITHM FOR MIS 
HA: 无 向 国 G(V,E); 
输出 : GHARI, ISV. 
begin 
(D feo;  G'V,E)-G(V,E); 
Q) while G’¢ do / * (2.1) (2.320 439 * / 
(2.1) for cach i: eV’ pardo / * 为 选择 一 个 随机 定 序 《 枚 举 ) x* / 
AX) a number randomly chosen from fl, a) 
endfor ; 
Q2) Pe’; 
(2.3) for cach i, f: (i, )eE' pardo 
if n(D2 z(/) then V-V- {i} ele l—7/— (ji endif 
endfor ; 
(24) elol; 
(2.5) Y-roN(Q); 
(2.6) G' = (V',E^) is the induced subgraph on V'— Y 
endwhile 
end. 


在 算法 11.3 中 ， 所 有 随机 变量 (i), te V^ 值 的 选取 是 相互 独立 的 。 这 似乎 是 超出 
T MIS 算法 框架 结构 的 思想 ， 因 为 在 某 些 情况 下 ， 完 全 有 可 能 存在 这 样 的 边 (1,4 )e E' 
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县 x(i) 一 x0)， 然 而， 这 并 不 影响 我 们 的 讨论 ， 由 于 任何 一 对 有 边关 联 的 顶点 i 和 它们 
具有 相同 值 的 概率 仅 为 1/ n. 而 顶点 集 V 中 至 多 有 CL 个 顶点 对 ， 故 z 是 Vr 中 的 一 


个 随机 定 序 的 概率 至 少 为 1 一 1/ 20”, 

现在 我 们 介绍 另 一 个 较 算法 11.3 复杂 一 点 的 随机 并 行 算法 ， 它 将 在 后 面 被 转换 成 确 
定 的 并 行 算法 。 

令 dG) BWA ie v/ E GVE) PIRRE, RA Y = {eoin(ijlieV 人 是 相互 独立 
的 0/1 随机 变量 集合 .车 4(i) > 1， 则 coin) 等 于 1 的 概率 是 1/24(i); Hal) = 0, 
则 coin(s) 恒 为 1。 另 一 个 计算 MIS 的 随机 并 行 算法 描述 如 下 : 


算法 11.4 COMPLEXED RANDOMIZED MIS ALGORITHM 
RA: 无 向 图 G(V,E); 
输出 : G 的 一 个 极 大 独立 集 I，T 后。 
begin 
(D Tri GWEN G(,E); 
(2) while G’#@ do 
(2.1) for each i: ie V’ pardo 
d(i) - DEE} 
endfor ; 
Q2 rep; 
/ * 选择 步 (2.3)~(2.4)* / 
(2.3) for each i: iey’ pardo 
(2.3.1) if q()-0 
then coin(i) — 1 
else coin(i)< randomly choose a value from {0,1} 
endif ; 
(2.3.2) if coin(i)=1 then 7 — uil endif 
endfor ; 
(2.4) for each i,:(i,j)e E' pardo 
if Gel’) and (je?) 
then if di) < dj) then Ver~ {i} 
ehe 了 了 二 了 一 人 
endif 
endif 
endfor ; 
(25) redur; 
(2.6) Y-roN(); 
(2.7 G'(V'^E') is the induced subgraph on V/— Y 
endwhile 
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end. 


11.3.4 ”随机 并 行 算法 的 复杂 性 分 析 
现在 我 们 来 分 析 上 述 两 个 简单 的 随机 并 行 算法 的 计算 复杂 性 ， 它 们 的 分 析 证 明 非 党 

相似 . 在 算 法 113 和 11.4 中 ，while 循 环 的 条 件 是 G' 关 中 ， 当 G' 关 中 时 执行 循 
BRL der Alt, 分 别 表示 算法 11.3 和 11.4 在 整个 while 循环 体 的 执行 次 数 。 下 而 将 证 
明 : 1， We, 的 期 望 执行 次 数 都 是 O(logn)。 我 们 将 证 明 : 在 平均 情况 下 ，while 循环 体 的 
每 次 执行 ， 都 将 使 边 集合 E 中 的 边 数 减少 一 个 常量 因子 .对 算法 11.3 和 11.4 的 while f 
环 体 来 讲 ， 车 在 第 次 执行 前 E’ 中 的 边 数 ， 分 别 用 了 4 和 Y, 来 表示 ， 则 第 大 次 执行 后 
删除 E' 中 的 边 数 分 别 为 了 4 Y, MYT 一 了 ki 

HA iev Budzi > 

sum()- Y 1/ ds) 
pem 
引 理 11.1 Sp, >p, 227, 20 EORR WEB icin, $ 
27D B-L np y, 7 2, — cB, 

其 中 : c 是 大 于 0 的 常量 ， 那 么 有 


maxfy,| 1 <i<n}> minfa , 1/c}/2 
证 明 ”用 归纳 法 证 明 . 要 使 8, 极 大 化 ， 只 有 p =p, =p, 一 %/ 1， 这 就 得 到 
B, «a; *(— 0721 
因此 y, >a (1— ca (l 1/20 
Ha «/c My, 2a,/2. a ele, My, >10. 否则 ， 存 在 一 个 1,， 1<i<n 
Ba, ,«l/eca &1/c* I/(I— 1. Bp, 2p, > >p, HURSARY. Ale 
BATE y, 217 2c. 
引 理 11.22. AMR, MAO 的 任意 一 个 顶点 ieV' 且 dlij>1， 有 
P(ieN(I^)) > min(sum(i), 1} > (1—17 2n )/4 
证 明 ” 设 x 是 六 的 一 个 随机 定 序 ， 且 概率 至 少 是 1~1/2x .对 任意 的 je v^, ERE, 
Æ n(7) <minfx(k) | keadjC)t MEH, 4 adi) = {12.4}, p, - P(E)=1/(d(i) 
+DA p 之 … > pao， 那么， 根据 包含 排斥 原理 ， 对 所 有 的 上 11d), A 
PENY > PUE) > Le, - EE uy) 
对 固定 的 j,k, De Per <l, 4 E' Balj) « minfz(v) | reads) v adXk)} 的 事件 ， 令 E", 
Æ n(k) « min[n(y) | veadi(/) v adik} 的 事件 ， 令 dak) = adi) o ad) |, BA, 
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P(E ^E,) < P(E’, P(E, IE’) + P(E JE") 


1 1 1 
< (ei *anzi) 
S2pp, i 


An 
令 x= 站 p,， 由 引 理 11.1 可 知 ， 当 zx 是 六 的 一 个 随机 定 序 时 ， 有 


hs 
P(ieN(I^)) > minfa, 1/2} / 2 > min{fsum(i), 11/4 : . 
98113 ”在 算法 11.4 中 ， 对 图 G 的 任意 一 个 顶点 ev’, Ho aio 1, 8 
P(ieN(I')) > minfsum(i)/ 2, 11/4 . 
证 明 ”对 任意 一 个 Je V^, Q E, RE coin) - 1 HHH, AS p, - P(E) 21/246). ， 
FRM, Fadi) = {Led}, p, 2p,2-2p,, SE 是 事件 EI， 对 2<J 
«d SEE 如 下 : 


E’,=(()~E,)nE,. 4,= N ~E, 


m 
那么 
«n 
PüeNQ^) > Y, (E' )P(A JE ) 
mi 
但 
P(A|E')2 P(A, )21— Y, p2172 
venitj) 
LOL 
H 
dD 0 
XPG')- RUE) 
E Pa . 
Stk s Xt, PUE RE) = p,* 下。 因此 由 包含 排斥 原理 ， 对 1< 1<d(P) 有 
" 1 i rai 
BUE)» FUE); Zr- P,* Py 


it int pe mn 


4 
4a—XYp, 由 引 理 11.1 可 知 ， 

m 

«n V 
P(E) 2 minfa,1} / 2 > minfsum(i) / 2, 1}/ 2 
故 推 得 
P(ieN(I^)) 2 minfsum(D / 2, 11/4 

定理 11.2 在 SIMD 一 CRCW PRAM 上 ， 并 行贿 机 算法 11.3 及 11.4 中 的 while 循环 
体 ， 第 大 次 执行 时 ， 删 除 边 的 期 弃 值 分 别 为 


(D E(Y,—-Y, )2 Y,/8—1/16 


—202— 


Q BOP YE DPY, 
证 明 BÆR k KWIT while 循环 体 前 的 图 是 G'(V^,E").. YE while 循环 体 执行 中 删除 的 
边 ， 其 端点 至 少 有 一 个 是 在 集合 DON(GOO 中 ， 郑 对 每 条 被 删除 的 边 GJ) RA i 
eru), RA jeloNQ). Bit. 


E(Y, — Y,,02 Dal) Piel’ o NQ»/2 
E 


> Xd) PeNQ?)/2 
E 


定理 剩 下 的 证 明 ， 分 别 要 引用 引 悍 11.2 和 引 理 11.3， 这 里 我 们 只 证 明 后 者 . 
由 引 理 11.3 可 知 ， 


P(eN(I) > minfsum(i)/ 2, 1}/ 4 
因此 ， 
E(Y,—-Y, ) > 


kel 


È d@sum(i) / 2 + L zan) /8 


smth>2 


V" sdin 


(z 
"(EX X 40) 240) 3 X i) 78 
( 


m 
2| E @@/ atau a) /2+ Y (dli)/ 2a) + 
Gree [757.4 
zz EZ 
+ 52/8 
E 


24E1/8—Y,/8 
类 似 地 可 以 证 得 E(Y — Y,, 02 Y, /8—1/16. 
定理 11.3 在 SIMD — CRCW PRAM 上 ， 计 算 一 个 无 向 图 G(V,E), |VI=n,，|El= 
的 极 大 独立 集 的 随机 并 行 算法 11.3， 它 的 期 望 时 间 为 O(logz)、 处 理 器 数 为 O(n). 
WEB] ”由 定理 11.2 我 们 知道 ， 在 SIMD - CRCW PRAM 上 ， 每 次 执行 while 循环 体 
时 ， 从 E’ 中 删除 的 边 数 ， 其 期 望 值 为 大 于 0 的 一 个 常数 故 到 G^ = 中 时 ，while 循环 体 
期 望 的 执行 次 数 是 O(logn)。 而 算法 使 用 了 .m 个 处 理 器 (m > A)， 其 余 各 步 均 可 在 OD 时 
间 内 完成 ， 所 以 算法 11.3 的 期 望 执行 时 间 为 O(logn)、 处 理 器 数 为 Om). 
定理 11.4 在 SIMD — EREW PRAM 上 ， 计 算 一 个 无 向 图 G(V,E), |V| — n. Elm 
的 极 大 独立 集 的 随机 并 行 算法 11.4， 其 期 望 运行 时 间 为 O(log*n)、 处 理 器 数 为 O(n), 
证 明 ”由 定理 11.3 知 ， 算 法 11.4 的 while 循环 体 期 望 的 执行 次 数 为 O(logn})， 而 在 SIMD 
一 EREW PRAM 上 实现 集合 归并 等 运算 需 O(logn) 时 间 、O(m) 处 理 器 ， 故 整个 算法 的 
期 望 执行 时 间 为 0(log”n)、 处 理 器 数 为 0(m)，m > cn，c 为 大 于 0 的 一 个 常数 . 
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11.3.5 PADI IPT GE PERS 

通常 ， 把 算法 中 每 步 执行 是 确定 的 、 而 不 具有 随机 选择 的 一 类 算法 称 之 为 确定 性 算 
法 .那么 ， 什 么 样 的 随机 算法 可 以 转换 成 等 价 的 确定 性 算法 呢 ? 它们 之 闻 是 怎样 转换 的 ? 
现在 来 研究 这 些 问 题 。 首先 我 们 给 出 转换 的 基本 策略 ， 然 后 利用 这 种 策略 ， 将 随机 并 行 算 
法 11.4 转换 成 一 个 确定 性 并 行 算法 。 
1. 转换 的 基本 策略 

要 将 一 个 随机 并 行 算法 转换 成 一 个 确定 性 并 行 算法 ， 为 了 转换 方便 ， 应 尽量 这 样 来 描 
述 随机 算法 : 将 算法 的 随机 性 都 包括 在 一 个 选择 步 里 ， 这 一 步 在 算法 执行 过 程 中 可 能 多 次 
执行 ;在 选择 步 里 ， 随 机 变量 X Xo X, o, 的 值 的 选择 是 互相 独立 的 ， 因 而 从 平均 角 
度 来 讲 ， 这 些 随机 变量 的 值 集合 是 好 的 (Good); 算法 在 执行 选择 步 时 能 很 快 地 判别 一 组 
随机 变量 的 值 集合 的 好 坏 ， 且 迅速 地 选择 好 的 值 执行 下 去 ,算法 分 析 证 明 : 若 每 次 执行 选 
择 步 都 选择 了 一 个 好 的 值 集合 ， 则 在 一 个 给 定 的 时 间 界 内 ， 算 法 输出 一 个 正确 的 解除 此 
之 外 ， 还 应 附加 一 些 限制 条 件 ， 即 是 : 

{1) 设 r>0 是 一 个 整数 ，9q 之 4 是 一 个 素数 ， 且 + 和 4 ERF ”的 多 项 式 内 ， 则 随 
机 变量 X, X07, X, PMX, 取 值 范围 是 R 一 {R,,…, R,}， 而 且 X, 的 值 为 R ,的 


概率 是 ms /q. JOB TARE OM Hao Yung 


(2) ”在 算法 分 析 时 应 当 证 明 : BX, Xo, 天。 仅仅 是 成 对 独立 
的 (Pairwise Independent) 的 随机 变量 ， 则 随机 变量 X, Xp e XQ, 的 值 集合 是 好 的 
值 集 合 的 概率 大 于 0， 即 好 的 值 集合 总 是 存在 的 。 
2. 选择 步 的 模拟 实现 

在 随机 并 行 算法 11.4 中 ， 除 了 选择 步 引入 了 随 向 性 以 外 ， 其 它 步 又 都 是 确定 的 ， 性 
需 进 行 确定 性 模拟 。 因 此 ， 我 们 只 要 对 选择 步 并 行 地 进行 确定 性 模拟 。 选 择 步 的 模 氢 如 
F: 

构造 一 个 具有 9 ”个 祥 本 点 的 统率 空间 ， 在 这 个 空间 中 ， 每 个 样本 点 对 
BEX Xi …, 王 ;的 一 个 值 集 合 。 并 行 地 产生 4^ 个 算法 的 拷贝 ， 每 个 样本 点 赋 给 一 个 
找 幢 ， 并 行 地 测试 哪些 样本 点 是 好 的 ， 选 取 对 应 的 钱 ,, X. X, 的 值 集合 是 好 的 样本 
点 作为 选择 步 的 输出 。 

由 于 具有 大 于 0 概率 的 随机 样本 点 是 好 的 ， 故 至 少 存在 一 个 样本 点 一 定 是 好 的 ， 又 因 
为 在 每 次 执行 选择 步 时 都 采用 X. X... x, V 的 一 个 好 的 值 集合 ， 所 以 转换 后 的 算法 
基 确定 的 ， 并 保证 在 给 定 的 时 间 界 内 执行 完毕 。 

4 XQ, os X, 是 满足 约束 条 件 (1) 的 随机 变量 。 下 面 将 证 明 : 在 生成 的 g? 个 样 
本 点 的 概率 空间 中 ， 随 机 变量 是 成 对 独立 的 。 在 一 个 随机 变量 相互 独立 的 概率 空间 中 ， 若 
每 个 随机 变量 具有 非 零 概率 值 至 少 有 两 个 ， 则 得 到 的 样本 点 的 数目 至 少 是 Q(2”). 

怎样 产生 上 述 性 质 的 概率 空间 呢 ? 我 们 现在 介绍 如 下 : DEJES n x 9 BERE A. A 
的 第 行 对 应 随机 变量 x 的 可 能 取 值 ， 则 4 的 第 i 行人 恰好 含有 n, 项 等 于 R,, 令 0 
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Xx y«q—l BMPR BU 定 义 为 : 
b^? Lp, by, nm b, 
其 中 6 = Aso na ÈX, RAR BO” MA. BAIR OR A DAE 
5174. 则 得 到 以 下 的 诸 引 理 。 
引 理 11.4 P(Y,- R)-n,7q. 
证 明 固定 六 恰好 存在 q 对 x,y, 它们 满足 : ty i) mod gal Al ta, 
HA =R, 
引 理 11.5 P(X,=R, and X, R,)- (1,7 1,274". 
证 明 ”车 固定 1 及 1， 恰好 存在 一 对 x,p， 使 得 (x+y" 让 mod q-1 R(x 


+y- P) mod 9 = 上 同时 成 立 。 
引 理 11.5 证 明了 随机 变量 X ,, X, e X, , 在 构造 出 的 概率 空间 中 是 成 对 独立 


A. Luby 还 把 成 对 独立 的 概念 推广 到 d 一 对 独立 概念 上 ， 并 给 出 了 一 般 的 产生 d 一 对 


独立 随机 变量 的 概率 空间 的 方法 ”， 这 里 就 不 再 介绍 了 ， 
在 算法 11.4 中 ， 若 随机 变量 coin(i), ie V' 仅仅 是 成 对 独立 的 ， 则 对 任意 ie V". GE 
ME, 是 coin(i) = 1 事件 ， 邻 p, — P(E,) = 1/24d(i)， 下 面 我 们 将 证 明 : 在 新 的 定义 下 ， 


算法 11.4 有 关 的 引 理 及 定理 仍然 成 立 . 
引 理 11.6 P(eNQ^)2 minfsum(i), 11/8. 


证 明 令 %, 一 0, 对 1 < 1< 40), 9s, Dp, Bl 


2 
PGeNG') > Y, PG )P(A JE" ) 


又 因为 
P(A JE' ) -1— P(~A JE’) 
但 是 


P(WA JENS Y P(E IE) 
read) 
ih 


BH 
P(E JE /) e P(E, - E nemo E, E )/ PE emo E, AE) 
< PE )/ Q — P(U E JE D) 
<p,/- XPFEJE) 


-p5,/0—2,4) 
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P(WA JENS Y P,/ 0-a )«1/20—a, ) 
x 


因此 
P(AJE/)- 0 — P( 4 JE > (1-2, DZ201 一 wy ) 
PUR!) = P(E YP(~E NN E, E) 


ni 
=p (1 -P(UE E D> p-a) 
m 
BRA, Wi<i<dv) Ea, «1/2, di 


PieNW) > Lp- 20, )/2 
^ 
-(Ep,-2Y3 X pt 
ramon 
由 引 理 11.1 得 
PENG) > minfa y 1/24/74 
> min{sum(i),1}/8 | 
定理 11.5” 当 随机 变量 fcoin(Dlie V} 是 成 对 独立 时 ，E(Y% — Y,» Y, / 16. 
证 明 “类似 定理 11.2 的 证 明 ， 只 需 在 证 明 中 用 引 理 11.5 其 换 引 理 11.3 即 可 , 
由 引 理 11.3、11.4 及 定理 11.5 可 知 ， 算 法 11.4 几乎 满足 了 转换 条 件 的 要 求 。 随 机 变 
Hi {coin ieV 全 的 取信 范围 是 f0,113， 若 把 它 的 一 个 值 集合 应 用 于 选择 步 时 ， 至 少 使 已 
的 边 数 删除 掉 1/ 16， 则 这 个 值 集合 是 好 的 值 集合 . 
定理 11.5 蕴含 着 :车 随机 变量 fcoin(i) ie V} 是 成 对 独立 的 ， 则 在 任何 一 个 概率 空间 
内 至 少 有 一 个 样本 点 对 应 的 值 集合 是 好 的 . 
然而 ， 根 据 随机 变量 fcoin(i)| ie V} 的 最 初 定义 ， 它 们 不 符合 转换 限制 条 件 的 第 (1) 
条 .为 此 ， 我 们 需 对 {coin eV} 的 定义 做 两 点 修改 : 对 {coin ieV 全 的 赋值 概率 要 
修改 为 : 令 9 是 一 个 ms 和 9< 2” 的 素数 ， 我 们 赋予 coin(i) - 1 的 概率 是 p, 
= Lp 491 /4, ŽP p, - 17 2d(y; 此 外 ， 对 算法 11.4 也 要 作 相 应 的 修改 ， 修 改 后 的 算 
法 如 下 : 


算法 11.5 IMPROVED RANDOMIZED MIS ALGORITHM 
MA: 无 向 图 G(V,E); 
输出 : G 的 一 个 极 大 独立 集 [，JE VV。 
begin 
Q) Tot;  G' E) - GOV,E); 
(2) compute a prime 9 such that n<q<2n; 
(3) while G'# do 
(3.1) for each iiey’ pardo / * 计算 每 个 顶点 i 的 度数 */ 
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dD el | Ge EH 
endfor ; 
(3.2) for each i: ie V/ pardo 
if d()=0 then To Pofl; V'—V'—(i) endif 
endfor ; 
(3.3) find ie V" such that. d(i) = maxíd(j )| j ev}; 
(3.4) if d()2n/16 
then 
G41) 1—Iofil; 
(3.42) Vie V' — fibuadXD ; 
(3.4.3) E'«— E' — ((,/) | jead X01 
ele /* VicV', di)«n/16 */ 
(3.4.4) randomly choose x and y such that 0<x,y<q—1; 
(3.45) Xe; 
(3.4.6) for each i: ie V^ pardo 
compute n(i)«e—1gq/2d()) ; 
compute /(i)— (x + y * i) mod g; 
if (i)<n(i) then X Xu{i} endif 
endfor ; 
BAD) Lex; 
(3.4.8) for each i,j: (i,/)eE’AGeX)ACeX) pardo 
if di) <d) then Fer- {i} 
else oI— {i} 
endif 
endfor ; 
3.4.9) fell; 
(3.4.10) Y - PUNE); 
(3.4.11) G'(V',E') is the induced subgraph on V'— Y 
endif 
endwhile 
end. 


在 算法 11.5 中 的 第 (3.4) 步 ， 满 足 (0 n/ 16 的 情况 至 多 出 现 16 次 。 这 是 因为 由 定 
理 11.5 知 ， 每 次 执行 while 循环 体 至 少 使 原 图 的 边 数 减 少 了 17 16， 故 在 执行 循环 体 16 
次 以 后 ， 得 到 的 图 其 顶点 度数 满足 i) c n/ 16, BI'VieV', dü)«n/168X. Uia 
/2dü)zn/2d()-8. Bii p> 8g， 也 就 意味 着 1p, gl] /821. 又 因为 (lp; q) 41/4 
2p 所 以 (8 /9)px PS p. 
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$38 11.7 ” 设 随 机 变量 (coin(i) | ie 人 是 成 对 独立 的 ， 且 P(coin(i)=1) =p’, Vi 
EV’, d(i) «n/16, IA P(ieN(I)) 2 min{sum(i),1} / 9. 

证 明 — 7 8/9p, EH P(coin()) = 1 MF. Jl p, A P(coin(i) = 1) 的 上 界 ， 除 此 之 
外 ， 其 余 的 证 明 与 引 理 11.6 相同 , 

定理 13.6 ”在 算法 11.4 中 ， 按 修改 后 的 随机 变量 [coin(Dlie V1 MIA. AXE i 
eV’, di)<n/16, MEY; — Y, 2 Y, / 18. 


证 明 ”类 似 定 理 11.2 的 证 明 . 只 要 在 证 明 过 程 中 ， 用 引 理 11.7 替换 引 理 11.3 即 可 得 
证 . 


因此 ， 车 对 任意 iev HA 40) <n /16， 则 每 次 执行 while 循环 体 删除 E 的 边 数 ， 

其 期 望 值 是 整个 图 边 数 的 17 18, 

定理 11.7 在 SIMD 一 EREW PRAM 上 ， 计 算 一 个 无 向 图 G(V,E), IVi=n, |E|=m 
的 极 大 独立 集 ， 算 法 11.5 的 期 望 运行 时 间 为 O(log n). ERRA Om), mn. 

证 明 ”在 算法 11.5 中 ， 第 (1) 步 和 第 (2) 步 至 多 需 OM) 时 间 、 O(n) 处 理 器 ， 由 定理 11.6 
知 ，while 循环 体 期 望 的 执行 次 数 为 O(logn)。 第 (3.1) EFF Odlog) 时 间 、O(m) 处 理 器 ; 

第 (3.2) 步 需 O(logn) MTA. O(n) 处 理 器 ; 第 (3.3) 步 需 O(logn) WE, O(n) 处 理 器 ; 

第 (3.4) 步 中 的 每 个 于 步 至 多 需 0 (logn) MI. O(m) 处 理 器 。 因 此 ， 算 法 11.5 期 望 的 运 
行 时 间 为 Clog "ma)、 处 理 器 数 为 O(m). 

由 上 面 的 叙述 可 知 ， 算 法 11.5 已 满足 了 转换 条 件 的 所 有 要 求 ， 它 的 确定 性 转换 就 变 
得 非常 简单 ， 只 需 并 行 测试 对 应 随机 变量 fcoin(i)lie V^) 值 集合 的 概率 空间 中 的 9? 个 样 
本 点 ， 然 后 从 中 选择 这 样 一 个 值 集合 ， 使 得 该 集合 能 从 G 中 删除 的 边 数 最 多 。 故 整 
个 while 循环 体 的 执行 次 数 至 多 需 


(logn? / Note) + 16 < 25logn + 16 


3， 极 大 独立 集 问题 确定 性 并 行 算法 的 形式 化 描述 
有 了 上 面 的 准备 之 后 ， 现 在 我 们 描述 极 大 独立 集 问题 的 确定 性 并 行 算法 。 


算法 11.6 DETERMINITIC PARALLEL ALGORITHM FOR MIS PROBLEM 

输入 : 无 向 图 G(V,E); 
输出 : G 的 一 个 极 大 独立 集 J，I Sy。 
begin ^ 
(D Iep; GE) G(,E); 
(2) compute a prime 4 such that n xq €2n; 
(3) while G' 关中 do 

(3.1) for each i,j :(4,j )eE' pardo 

HN 10,7 )e Ed 
endfor ; 
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(3.2) for each i,x,y : ieV',1& x,y <q pardo 
d(i,x,y) «- (i) 
endfor ; 
(3.3) for each i: ie V’ pardo 
if d(i)— 0 then To Juf{i} endif 
endfor ; 


(3.4) for each j :je V’ pardo 
d(i,) - max (a(j)| je V°} 
i 
endfor ; 
(3.5) if 4G) 2 n / 16 


then 
G51) Ic-Io(ut; 


(3.5.2) G' is a graph induced on the vertices V! — (fi, po fadi fion 


ese /* VicV', d) «n/16 */ 
(3.5.3) for each x,y : 0€ x,y &«q—1 pardo 
G54) XD; 
(3.5.5) for each i: ie V’ pardo 
n(ix,y) Lg / dlix, y) ; 
Ki,x,y) — (x + y * i) mod g; 
if U(i,x,y)<n(ix,y) then X(x,y)— XX) 
endfor ; 
(3.5.6) Pe X(x,y); 
(3.5.7) for cach i,j : ie X(x,y)A je X(x.y) pardo 
if Gj ez’ 
then if d(i,x,y) < d(J x,y) 
then F(x,y} PG) — {i} 
ele (xy) - oy - £1 


endif 
endif 
endfor ; 
(3.5.8) Y(x,y) - l'oy)o NO'Goy) 
endfor ; 


(3.5.9) for cach x,y: 1 & x,y <q pardo 
find a set Y(x,,y,) such that 


IY Gy, = max (Y Gy) < x <a} 


endfor ; 


endif 
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(3.5.10) IcCIOl(xay i 
(3.5.11) G'(V',E^) is the induced subgraph V'— Y(x,,y,) 
endif 
endwhile 
end. 


定理 11.8 在 SIMD — EREW PRAM 上 ， 计 算 一 个 无 向 图 :G(V,E), |Vp— n, (E| o m ff 
极 大 独立 集 ， 确 定性 并 行 算法 11.6 需 O(log^n) BERE. Omn) 处 理 器 ， 

证 明 ”算法 11.5 与 确定 性 算法 11.6 的 区 别 在 于 : 后 者 每 次 不 是 随机 的 选择 一 个 样本 点 ， 
而 是 对 概率 空间 的 每 个 样本 点 同时 执行 算法 11.5， 因 而 所 需 的 处 理 器 数目 为 O(m4”)。 又 
在 while 循环 体 中 ， 与 算法 11.5 不 同 的 是 : 确定 性 算法 11.6 的 第 (3.5.9) 步 找 最 大 值 
需 Oldiogg?)= Ollogg) 时 间 ， 前 而 的 分 析 已 经 得 出 ，while 循环 体 至 多 执行 2510gn + 16 
次 。 所 以 确定 性 算法 11.6 需 O(log^n + lognlogg) = O(log n) HB. Oleng) = OGmn’) 处 
3d. 


114 有 效 的 极 大 独立 集 并 行 算法 


11.4.1 基本 概念 

在 本 章 引 言 中 曾 提 到 ， 无 向 图 的 MIS 问题 可 归 约 为 最 大 着 色 问 题 ， 通 俗 地 讲 ， 若 在 
图 中 能 找 出 它 的 MIS， 对 MIS 中 的 顶点 着 上 同一 种 颜色 ， 则 不 会 和 邻 集 顶 点 的 颜色 相 
同 ， 可 导致 图 的 一 个 最 大 着 色 ; 反之 ， 若 在 图 的 最 大 着 色 数 的 顶点 集中 ， 将 着 相同 颜色 的 
顶点 汇集 起 来 ， 它 就 是 图 的 一 个 MIS。 在 这 一 节 中 ， 我 们 通过 对 图 的 顶点 着 色 来 求 图 
的 MIS. 关于 图 的 顶点 着 色 ， 将 在 下 一 章 进行 详细 的 讨论 ， 

在 SIMD —EREW PRAM 上 ，Goidberg 等 人 对 MIS 问题 建议 了 第 一 个 确定 的 并 行 
AE 。 本 节 就 来 介绍 这 个 确定 的 并 行 算法 ， 

设 G(V,E) 是 一 个 无 向 图 ， 广 = (0,1, ,n—1. CSV —4 DURER. GCE 
示 G 中 由 CC 内 顶点 导出 的 一 个 子 图 G 的 一 个 部 分 着 色 平 定义 为 对 G 的 


部 分 顶点 集 C1, s CL 进行 着 色 ， 且 满足 C,nC) = Gey), C, EV. UC, Y. 


集合 C, 中 的 顶点 着 第 1 种 颜色 (1 cic p. BUC, -V MEY H G 的 一 个 完整 着 


色 , 下 =fCi Curs C, G -PERRE V 指 的 是 im |VI， 即 是 G 的 所 有 顶点 都 
着 上 互 不 相同 的 颜色 。 为 了 后 面 的 讨论 方便 ， 我 们 约定 : 没有 着 色 的 顶点 置 颜色 标记 
为 0。 已 删除 的 顶点 的 着 色 标记 为 一 1。 每 步 操作 仅 对 着 色 标 记 > 0 的 顶点 进行 . 

Y - (C, ,CC 是 一 个 部 分 着 色 集 ， 定 义 矩阵 DOV) - (2,),, ARRON 


H prp 


一 210 一 


如 下 
d, -W(C)n€J, Sid «p; 
QV) = max [IC || + IN(C N} 
pon 


车 里 是 G 的 一 个 部 分 着 色 ， 且 | 平 1= p， 则 由 里 及 常量 h >0 定义 了 一 个 无 疝 
BBV, EQ, REV, o (Cum CLE, (0,0, ld, 24H, 2h 


图 G(V,E) 的 补 图 G° (VEN 定义 为 : E'- (x V)— E. 


11.4.2 算法 的 形式 化 描述 

我 们 采用 自 项 向 下 的 策略 进行 搭 述 ， 先 用 框架 结构 概略 地 描述 整个 算法 ， 然 后 对 算 
法 的 框架 结构 一 步 一 步 地 展开 ， 直 至 得 出 一 个 完整 的 详细 算法 为 止 ， 
1, MIS 算 法 的 框架 结构 

算法 的 描述 框架 也 遵循 Karp 的 结构 ， 为 了 叙述 的 完整 起 见 ， 这 里 再 现 这 种 框架 如 
T 


算法 11.7 MIS ALGORITHM BY KARP 
输入 : 无 向 图 G(V,E); 
输出 : GK-k ISV. 
begin 
0) 1-6; / + 7 是 G 的 极 大 独立 集 * / 
Q) A-V; 
(3) whik 4 关中 do 
(3.1) CEFINDSET(4); 
(32) I-IoC; 
(3.3) 44 -(CoN(C) 
endwhile 
end. 


若 每 次 执行 函数 FINDSET 仅 需 O(log" n) 时 间 ， 且 产生 一 个 独立 集 C 满 
Æ ICUN(C) =Q(141/ log? AD. WER 11.7 可 以 在 O(log? n) 时 间 内 完成 ， 其 中 9， 
>0, 5,20, s, 2 max(s,, s]. 且 它 们 均 为 常量 . 
2. m% FINDSET 

函数 FINDSET 的 目标 试图 从 万 = G[A] 中 找 出 一 个 独立 集 C， 使 得 C 满 
足 ICUN(C)| > c,k/logk. 天 一 14|，c。 为 一 个 正常 数 。 为 此 ，FINDSET SEU I: F 
始 时 对 G[4] 进行 平凡 着 色 中。， 即 对 每 个 顶点 着 上 互 不 相同 的 颜色 。 然后 构造 一 个 部 分 着 
色 序列 { 平 ， }，.J/ > 0、 每 产生 一 个 部 分 着 色 里 | FINDSET 就 检查 是 否 满足 

QUY , ) c, k / logk 
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若是 满足 ， 则 输出 着 某 种 颜色 的 顶点 集合 C，C 已 满足 1CI+ IN(C|> e, k / logk; 否则 ， 


它 将 对 某 些 着 色 顶 点 进行 去 色 ， 并 将 一 些 已 着 色 的 顶点 集合 并 成 为 一 个 较 大 的 顶点 集 ， 再 
对 合并 后 的 项 点 集 赋 给 新 的 颜色 ， 这 样 就 产生 了 一 个 新 的 部 分 着 色 Y, BARIY, | 
>F ib J 一 01…。 这 些 工作 将 由 后 面 将 要 介绍 的 函数 REDUCE 来 完成 . 

为 了 达到 去 色 的 顶点 数 尽 可 能 的 少 ， 且 使 合并 后 的 顶点 集 尽 可 能 大 .我 们 采用 了 一 
种 匹配 技术 、 先 将 两 个 着 色 集 合 C 和 C’ 进行 合并 ， 使 得 ICmN(C? 或 CN(C)| 尽 可 能 
的 小 ;然后 去 掉 CONIC R CANC) 的 颜色 ， 这 可 从 BL, 的 图 BL, 找 出 一 个 最 大 亚 
配 MM 来 完成 .也 就 是 说 ， 对 85， 中 的 每 一 个 匹配 对 (C,C?， 均 要 进行 合并 、 去 色 工作 . 

对 每 一 匹配 的 顶点 对 (C,C^)e M 来 讲 ， 其 操作 是 : 若 ICmN(COI<IC'mN(C) RISE 
集合 CAN(C 的 顶点 去 色 ; 否则 对 集合 CANO 的 顶点 去 色 . 然后 对 COC 中 剩 下 的 


顶点 着 新 的 颜色 ， 而 对 那些 未 匹配 的 顶点 集 仍 着 原来 的 颜色 ， 这 样 就 产生 了 G 的 一 个 新 
的 部 分 着 色 ， 


要 从 B4， 中 寻找 一 个 最 大 匹配 M， 首 先 需 构造 辅 图 By, XMM BUILD 完 
Hu 然后 根据 Bw， 很 容易 地 构造 出 2%,; 再 由 BL, 找 出 一 个 最 大 匹配 好 ， 后 两 项 工作 
是 由 函数 MATCH 完成 的 ， 这样 ，FINDSET 可 描述 如 下 : 


算法 11.8 FINDING A VERTICES SET 
RA: 图 G(J, 百 的 边 集合 EPRRFRACY: 
输出 : Hopp ax EC. Ce 了。 
function FINDSET(4) ; 
begin 
(0 keld; He Gi4]; 
{2) 更 一 trivial coloring of H ; 
{3) while Q(Y) < cok /logk do 
GA) peP]; kec k/ (plogk); 
G2) B,,  BUILD(YA); 
(3.3) M - MATCH(B, ); 
. G4) V — REDUCE(VA,M) . 
endwhile ; 
(4) C some vertex set such that |C] + |N(C) > cok / logk ; 
(5 FINDSET-C 
end . 


在 进一步 给 出 详细 算法 描述 之 前 ， 我 们 给 出 一 些 定义 ， 设 工 是 一 个 已 按 关键 字 函 数 
排 好 序 的 有 序 表 ， 我 们 把 工 中 具有 相同 关键 字 值 的 最 大 子 表 称 为 工 的 一 个 区 
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间 (IntervaD)。 每 个 有 序 表 可 简单 地 看 作 是 由 许多 区 间 连 接 而 成 的 。 

一 个 二 元 组 人 rs) 的 字典 序 小 于 另 一 个 二 元 组 (rs SARS 
<r' 或 1=r' 且 s<s'。 显然 ， 无 向 图 的 边 是 一 个 二 元 组 . 
3. 函数 BUILD 

函数 BUILD 用 于 构造 辅 图 B. O EE,)， 它 的 输入 是 图 GLA] 的 一 个 部 分 着 色 Y 和 
一 个 常数 h 0. HY, 是 颜色 的 集合 ，E, 的 计算 涉及 到 di,， HHA. HTH 
Fad,» BUILD 首先 创建 一 个 由 G[A] 的 边 组 成 的 表 工 ， 然 后 对 工 按 字 典 序 进行 排序 ， 
再 把 排序 后 的 表 中 元 素 (每 个 元 素 是 一 条 无 向 边 ) 的 每 个 端点 的 着 色 数 作为 关键 字 ， 对 工 
再 按 字典 序 进 行 排序 . 之 后 在 工 上 定义 区 问 是 端点 着 同一 种 颜色 的 最 大 子 表 .. SL, Æ 
端点 着 第 工种 颜色 和 第 / 种 颜色 的 区 间 ， 对 每 个 区 闻 工 ,， 来 说 ， 若 以 着 第 7 种 颜色 的 顶 


点 作为 关键 字 ， 对 上， 进行 排序 ， 则 排序 后 工 ， 所 售 的 于 区 间 ” KAMEA, i. 类 
BU. XEL, 接着 第 :种 颜色 的 顶点 进行 排序 ， 排 序 后 的 子 区 间 数 目 即 是 d, 的 值 。 

为 了 确定 一 个 排序 表 的 各 个 区 间 ， 可 以 把 表 中 每 个 元 素 的 关键 字 ， 同 它 的 左 邻 或 右 
分 元 案 的 关键 字 信 进行 比较 ， 车 相等 ， 则 给 予 一 种 畦 殊 标识 否则， 将 该 元 案 标 识 为 一 
个 新 区 间 的 开始 或 结束 ， 然 后 用 路 径 折 大 技术 对 每 个 区 间 的 成 员 进 行 标识 比如 用 关键 
字 标识 ) 

BUILD 的 实现 细节 如 下 


算法 11.9 BUILDING A GRAPH 
输入 : 图 G[4] 的 部 分 着 色 平 和 正 的 常数 请 ; 
输出 : RAB, VLE D. 
function BUILD(¥,A) ; 
begin 
GQ) E,—6; 
Q) 对 GA) 的 边 接 字 典 序 进行 并 行 排序 ， 设 排序 后 的 有 序 表 为 上 ; 
{3) 对 工 以 元 素 端点 的 着 色 数 为 关键 字 按 字典 序 进行 排序 ; 
(4) T()-1; 7/* 标 识 数组 ， 两 小“"1” 之 间 的 元 素 都 属于 同一 区 闻 * / 
(5) for each i 1& i& m, pardo / * m, AEGAN + / 
if LQ) 端点 着 色 数 ALG es E 6e 
then 7T(2«-1 
else T(i) -0 
endif 
endfor ; 
(6) for each interval L, pardo / *ij 是 区 间 内 ， 边 的 两 端点 着 色 数 * / 


外 在 这 里 ， 子 区 间 定 义 为 :以 着 第 了 种 颜色 的 顶点 为 关键 字 排 序 后 组 成 的 子 表 , 
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(6.1) 以 着 第 j 种 颜色 项 点 为 关键 字 将 排序 ， 设 排序 后 的 表 为 ; 
(62 d, + 上 中 区 间 的 个 数 ; 
(6.3) 以 着 第 各 颜色 项 直 为 关键 字 将 乙 ,， 排序 后 的 表 为 工 ” ; 
d, HLS FERA AG 
(6.4) if (d, >A) and (4, >A) then E+E vi endif 
endfor 
end. 


因为 整个 BUILD 最 多 涉及 O(m) ^ zz HET. Bi Cole 算法 可 知 ， 在 SIMD 
—EREW PRAM 上 , f£ 0O(logm)= O(logn) 时 间 、O(m) AES". MURAR 
数 BUILD 的 执行 需 O(logn) 时 间 、O (m) 处 理 器 . 
4 ii, MATCH 


函数 MATCH 的 输入 是 无 向 图 By. WHE BY, 的 一 个 最 大 匹配 M、 对 算法 的 要 
RE: (D) 去 色 的 顶点 数 应 该 尽 可 能 的 少 ; (2) RATES RTS. BAX By 
中 任意 一 条 边 (C,C)，C 5 N(C) 或 C 5 NC 的 交集 中 元 素 个 数 至 少 有 一 个 小 于 等 
于 4， 所 以 删除 的 项 点数 只 能 在 By, 中 有 边关 联 的 顶点 之 间 进 行 ， 这 样 做 就 可 满足 要 
ROD). 为 了 满足 要 求 (2)， 我 们 需 在 BL, 中 寻找 一 个 最 大 丐 配 M， 直 观 地 讲 ， 寻 找 一 个 
图 的 最 大 匹配 可 归结 为 寻找 它 的 线 图 的 极 大 独立 集 、 因 而 用 直观 方法 是 无 法 解决 这 个 问 
题 的 。 我 们 采用 一 个 找 B, 最 大 匹配 的 新 方法 。 具 体 地 讲 ， 首 先 构造 一 个 po VISUS 
HARK, WK MUA x 种 颜色 进行 着 色 ， 使 得 同一 顶点 的 关联 边 着 不 同 的 颜色 ， 
其 中 车 p 为 奇数 ， 则 x — ps Bp 为 偶数 ， 则 x 一 p 一 1 结果 是 ， 图， 的 所 有 边 分 别 被 
划分 到 边 集合 P,，P,，…， PL, 某 一 个 当中 去 ， 这 种 边 的 划分 应 使 得 每 个 集合 P, ME 
的 边 数 相等 (0<i<x 一 D. BK, BA 0, ) 划分 到 集合 Plan) 中 去 (Index 作为 一 个 
函数 将 在 下 面 描述 ) 同样 地 ， 我 们 用 x 种 颜色 按 相同 的 划分 策略 对 图 B, 的 所 有 边 进 
行 着 色 ， 着 色 后 不 同 颜色 的 边 将 划分 到 集合 PB, PB, PB, 的 某 一 个 当 中 . 
E APB SP O<i<x), $ PB, J& PB 0<i<x} 中 边 数 最 少 的 一 个 集合 ， 则 
在 BBL, 中 对 应 的 一 个 最 大 的 边 匹 配 为 M =P 一 了 PB,。 下 面 给 出 MATCH 的 实现 细 
3. 


算法 11.10 FINDING A MAXIMAL CARDITICAL MATCHING 
WA: RANE, OURS: 
dh: BL wT RA BRM, 
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function Index(i, /, p}; 


begin 
if p is odd then Index — (i+ j) mod p 
else if J —p—1 then Index —2i mod (p— 1) 
else Index — (i -- j) mod (p— 1) 
endif 
endif 
end ; 


function MATCH(B,,);  / * 2+ / 
begin 
(D Mcó; pe; 
(2) if p is even then x —p—1 ee xp cndif; 
(3; for each i: O<i<x pardo 
Pied; PB,-Ó 
endfor ; 
(4) for each i,j :1<i,j <p pardo 
(4.1) i Index, j , p); 
(42) P,- P uiid t; 
(4.3) if (G,/)eE, then PB, PB,Uf(i,s)} endif 
/ GJB hs / 
endfor ; 
(5) for each I: O< 1 «x pardo 
find a set PB, such that |PB,|=min{|\PB,| 0<1<x}; 
endfor ; 
(6 MePN(P,— PB); 
(7) remove all but lp(c, — c,)/ 2c,1 edges from M 
end. 


引 理 11.8 在 SIMD — EREW PRAM Ł, HH BY, 的 最 大 匹配 ， 算 法 11.10 
38 O(logn) 时 间 、O(m) 处 理 器 。 

证 明 ”在 算法 11.10 中 ， 第 (D)~ (2) 步 仅 需 O(D 时 间 及 处 理 器 ; 第 (3) 步 至 多 需 0(D 时 
Ml. O(n) 处 再 器 第 (4) 步 是 为 第 (5)~ (6) 步 的 计算 而 设计 的 。 事 实 上 没 必 要 用 (p^) 处 
理 器 ， 仅 需 Olm) 处 理 器 执行 第 (4.3) 步 即 可 .也 就 是 说 ， 没 有 必要 计算 出 所 有 的 P, (0 
么 1 < 为 。 因 而 这 一 步 需 0(iogn) II. O(m) 处 理 器 ; 第 (5) 步 的 实现 如 下 : 先 将 By, 
的 边 按 关 键 字 Index 进行 排序 ， 设 排序 后 的 有 序 表 为 工 ,; 接着 是 找 出 工 ; 的 所 有 区 间 ; 
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然后 应 用 路 径 折 秋 技术 计算 每 个 区 间 所 会 的 元 素 个 数 ; BT Da TOR TR IS 
DRENA PB. HETRE Cole 算法 完成 ， 需 O(logn) HR, O(m) 处 理 器 . 

设 Index(i, J, p) — +， 不 难看 出 : 使 用 O(n) 处 理 器 在 常量 时 间 内 可 找 出 所 有 满足 约 
东 的 二 元 组 f, J | Index(i, j, p)=t}, B4 P, ={0, J) Index(i, j, p) i. XE M 
=P, o(P,-PB)APB SP, KM=P,—PB,. 第 (6) 步 可 通过 排序 实现 ， 首先 
HP, SPB 合并 成 一 个 表 工 ; 然后 应 用 Cole 算 法 对 工 按 字典 序 排序 ; .再 去 掉 重 复 的 元 
K (二 元 组 ) ， 剩 下 的 有 序 表 即 是 MM。 因 此， 第 (6) 步 至 多 需 O(logn) HA, Om) 处 理 
器 ; 第 (7) 步 可 将 有 序 表 元 素 向 表 头 移动 ， 以 填补 前 面 删除 的 元 素 ; 然后 只 保留 从 表 头 开 
始 的 前 面 『p(e ,一 c。)/2c,1 TAR. 3X b RT RERO Bos. M (7) 步 至 
ER Ollogn) ITE]. O(n) 处 理 器 ， 因 此 匹配 函数 MATCH 的 每 次 执行 至 多 需 O(logn) 时 
E. O(m) 处 理 器 ， 

5. M$ REDUCE 

B(C.C)eM, WIC MC’ 是 一 个 匹配 对 ， 则 在 集 C 中 着 第 I 种 颜色 的 每 个 顶点 需要 
知道 集 C 内 每 个 顶点 的 颜色 . 要 在 SIMD 一 EREW PRAM 上 完成 这 一 任务 、 这 里 使 用 
了 一 个 过 程 BROADCAST。 它 的 工作 是 将 着 第 1, 种 颜色 的 每 个 顶点 广播 消息 亚 ，， 

具体 来 讲 ， 过 程 BROADCAST 的 输入 是 由 二 元 组 (1,, m) 组 成 的 表 工 ,， 其 中 : d 
表示 着 第 ARE (HER). Ries, Wiel, im, BE ROR 
息 . BROADCAST 先 创建 另 一 个 由 着 色 顶 点 形成 的 表 工 ;， 每 个 着 色 顶 点 ER L, 的 
一 个 元 素 0,2) 1 是 » 的 着 色 数 ; 然后 将 工 ， 和 工 , 合并 成 表 工 ,， 并 以 着 色 数 为 关键 字 
SL, 按 字典 序 进行 排序 ， 当 工 , 和 工 ; 中 的 元 素 具有 相同 的 着 色 数 时 ， 约 定 工 ,的 元 素 排 
EL, 的 元 素 前 面 ; 最 后 应 用 路 径 折 和 登 技 术 ， 在 排序 后 的 工 , 中 每 个 区 闻 上 实现 消息 广 
播 ， 其 结果 是 : 着 第 / 种 颜色 的 每 个 顶点 将 收 到 一 个 消息 mm,，1<s j «II. 


算法 11.11 BROADCASTING IN A LINKED LIST 
WA: 顶点 子 业 4 所， 以 及 4 中 元 素 ， MARAE 
输出 : 4 中 元 素 的 着 色 ， 即 更 新 后 的 着 色 。 
procedure BROADCAST(M, ¥, A, Lye 


begin 

(1) create a list L, — f, 9) | 1,21, ved}; 

(2) form a list L, by concatenating Li and L, ; 
(3) sort L 3 by the first coordinate of cach element; 


implement broadcasting at each interval by applying path doubling technique 
on L 
E 


end. 
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显然 ， 算 法 11.11 在 SIMD — EREW PRAM E55 O(logn) iti]. O(n + m) 处理 
La 
HR REDUCE 除了 决定 对 哪些 顶点 去 色 、 以 及 对 一 些 不 同 着 色 顶 点 集 进 行 妇 并 外 ， 
还 需 对 着 色 的 顶点 的 着 色 数 重新 给 予 连 续 的 编导 ， 且 编号 始 于 1， 以 便 下 一 次 热 
fi MATCH 时 使 用 . 
函数 REDUCE 的 实现 细节 如 下 : 


算法 11.12 REDUCING IN A GRAPH 
输入 : BRM eX RARE D = (dit 
输出 : 对 每 个 re 进行 颜色 更 新 ， 更 新 后 的 颜色 为 iv)- 
function REDUCE(Y, h, M); 
begin 
(D Leo; Lep; 
(2) for each i,j: (i, )eM pardo 
if d, «d, 
then form a record(/ ,m(j),where m(j)— i; 
L =L uU, m» 
endif 
endfor ; 
(3) call BROADCAST (M, V, A, L,); 
(4) for each v : (ve A) and v receiving a color /(v) pardo 
if v is adjacent to a vertex of color /(v) 
then decolor v 
else change the color of v to i(v) 
endif 
endfor ; 
(5) sort the vertices by their (new) color ; 
(6) number the colors in use; 
(7) create a list L, its element(/, n(/)), where / is old color number, and a(i) 
is new color number ; 7 
(8) call BROADCAST (M, , A, L); 
(9) each colored vertex changes its color to the message it received 


end. 


引 理 11.9 在 SIMD — EREW PRAM 上 ， 算 法 11.12 至 多 项 O(logn) IB]. O(n + m) 
A. 
证 明 ”算法 11.12 的 第 (1) 4698 O (D) 时 间 及 处 理 器 ;第 (2) BY, AO P| 
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<a, WiM EB, 的 一 个 匹配 ， 赦 MI< Lay 24 ， 所 以 第 (2) 步 至 多 需 (logn) 时 
E. O(n) 处 理 器 ; 第 (3) 步调 用 过 程 BROADCAST $88 O(logn) HE. O(n + m) 处 理 
器 ; 第 (4) 步 实现 如 下 : 先 将 收 到 颜色 消息 的 顶点 的 邻接 边 形成 一 个 表 工 ， 然 后 对 工 按 字 
典 序 排序 ， 在 每 个 区 间 上 检查 另 一 端点 是 否 亦 着 了 接收 到 的 颜色 消息 ， 并 应 用 路 径 折 杰 
技术 于 每 个 区 间 ， 检 查 是 否 存在 收 到 同一 种 颜色 消息 ， 若 是 的 话 ， 则 此 顶点 去 色 ; m 
则 ， 此 顶点 改变 它 的 颜色 为 接收 的 颜色 。 这 些 都 水 及 排序 以 及 路 径 折合 技术 ， 故 最 多 
需 O(logn) 时 间 、O(n + m) 处 理 器 ; 第 (5) - (7) 步 类 似 第 (4) 步 ， 它 们 至 多 需 O(logn) 时 
Fl. O(n + m) 处 理 器 ; 第 (8) 步 同 第 (3) 步 类 似 ， 需 OQogn) Ht. O(n + m) 处 理 器 ; 
第 (9) 步 需 OI) 时 间 、O(n) 处 理 器 ; 所 以 整个 算法 11.2 需 Ottogn) 时 间 、Ofm + n) 处 理 
器 . 


11.43 算法 的 复杂 性 分 析 

我 们 的 目标 是 要 证 明 : 若 使 用 O(n + m) 处 理 器 ， 算 法 11.8 ME O(log n) 时 间 内 构 
造 图 G[4] 的 一 个 独立 集 C H CONC) > cok / logk， 这 里 ce， 是 一 个 正常 数 ，k = 14|。 
着 能 证 明 这 一 点 ， 则 不 难看 出 ， 极 大 独立 集 算法 调用 算法 11.8 Jt O(log”n) 次 ， 故 整个 求 
极 大 独立 集 算法 仅 需 0(log“n) 时 间 、O(n + m) AER. 

首先 我 们 分 析 算法 11.8 的 计算 复杂 性 ， 令 平 , 是 该 算法 中 while 循环 体 第 i 次 执行 前 
WE. $p, =Y, A EB, , 的 最 大 顶点 数 ，h, = ci 下/ pilogk，c, 是 一 个 正 的 党 
数 . 

BER ga, 中 ， 最 大 廊 数 顶点 v 所 在 的 着 色 项 点 集 是 C， 那 么 ， 一 方面 因 » 的 度数 
Ad, Kv SRE A, 个 着 色 顶 点 集中 的 顶点 相关 联 ， 因 而 N(C) 至 少 含有 AiA TH 

点 ; 另 一 方面 ， 由 算法 11.8 可 知 ，|N(C)| «ck / logk, MWA, h, <cyk/ logk, 

HI A,c,k/ plogk <c,k/logk, BEA, «cp, 7 e,. 这 就 意味 着 B, 的 每 个 顶点 的 度数 
至 少 为 (e, cep, / Cys BY, 的 边 数 大 于 等 于 (ec, 一 co)p? /2c,， e > co， 又 因为 
算法 11.10 将 By, 的 边 集合 划分 为 至 多 p, 个 子 集合 ， 其 中 P, 一 PB, 是 边 最 多 的 一 个 子 
集 ， 由 合集 原理 知 : |P, 一 PB [2 (c, 一 co)p, /ec,。 算法 11.10 将 删除 P, — PB, 中 的 一 
些 边 ， 最 后 返回 一 个 匹配 ;,， 且 Mi|= (ce 一 cu)pi/2c,。 当 算法 11.12 Oey, 
时 ， 去 色 的 顶点 数 至 多 为 

M le yk/ p,logk = (e, ~c,)p,/ 2c, . cik/ pilogk = (c, — e, / 2logk 
县 不 同 的 着 色 项 点 集 个 数 减 至 ap,， 其 中 a 二 (ce, + co)/ 2e， . 初始 化 时 部 分 着 色 平 。 
有 大 ==| 平 6| 种 颜色 ， 因 此 ， 算 法 11.8 的 while 循环 体 至 多 执行 一 logk / loga 次 ， 当 不 存 
YE, VI 1 HRE OM )m c, k / logk 时 ， 算 法 11.8 去 色 的 顶点 数 至 多 为 

— (logk / loga)(c, — c,)k / 2logk = — (c, — c,)k / 2loga 


fed 


1 
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结果 ， 内 剩 下 着 一 种 颜色 的 顶点 数 至 少 为 : 


(c, — c klogk 
o, -x-( ene )--6 — e,)k / 2( — loga) 


者 我 们 适当 选择 c, 及 c,， 使 得 对 某 个 确定 的 60. d 


— loga = ta Q* (14 2) 


e, 
xu 
那么 

Q, >ak/(1+8)>c,k/ logk 
BOW RAM, HO, c. k7 logk. 
定理 119 SIMD — EREW PRAM E, 计算 一 个 无 向 图 G(V,E), |V| 9 à. |E| 9 m 的 极 
大 独立 集 ， 算 法 11.7 8$ OQog'm) REIR. O(n + m) 处 理 器 . 
证 明 ” 因 算 法 11.8 的 while 循环 体 需 执行 O(logn) 次 ， 而 每 次 执行 此 循环 体 时 ， 调 用 算 
法 11.10 和 算法 11.12， 分 别 需 O(logn) MM. O(n + m) 处 理 器 。 求 极 大 独立 集 的 算 
法 11.7 需 调用 算法 11.8 O(log”n) 次 ， 故 整个 极 大 独立 集 算法 11.7 88 O log) 时 
间 、O(n + m) 处 理 器 。 


11.5 小 结 


本 章 重点 介绍 了 极 大 独立 集 问 题 的 并 行 算法 ， 计 算 图 的 MIS 的 品行 算法 非常 的 简 
单 ， 而 它 的 并 行 算法 设计 则 采用 了 完全 不 同 的 设计 策略 ， 且 比 申 行 算法 复杂 得 多 ， 本 章 除 
了 介绍 MIS 问题 的 并 行 算法 外 ， 还 引 人 了 随机 并 行 算法 的 概念 ， 介 绍 了 怎样 去 构造 一 个 
随机 算法 的 样本 空间 ， 以 及 叙述 了 将 一 个 随机 算法 转换 成 确定 算法 的 基本 原则 。 在 本 章 重 
点 介绍 的 两 个 并 行 算法 中 ， 第 一 个 算法 是 由 它 的 随机 算法 转换 而 成 的 ， 而 后 一 个 算法 则 完 
全 是 一 个 确定 的 算法 、 应 当 注 意 ， 我 们 在 这 里 不 仅 讨论 了 MIS 并 行 算法 设计 问题 ， 而 且 
还 间接 地 介绍 第 二 章 描述 过 的 迭代 改进 设计 技术 ， 这 种 技术 在 并 行 算 法 设计 中 ， 具 有 普 亡 
的 指导 意义 。 

有 关 家 大 独立 集 (MIS) 问题 的 并 行 算法 ， 除 了 上 述 介绍 的 以 外 ，Alon 等 人 也 曾 独 立 
地 建议 了 一 个 随机 并 行 算法 中， 在 SIMP - CCW PRAM 上 ， 他 们 算法 的 期 望 运行 时 间 
为 O(logn)， 使 用 的 处 理 器 数 为 O(mA)，A 是 图 中 顶点 的 最 大 度数 ; Goldberg 等 人 利 
用 Cole FA BH ME REAR” 建议 了 一 个 O(n ) 时 间 、O(n) 处 理 器 的 MIS 算 
HU, Ropa 是 大 于 1 2 的 某 个 任意 的 数 ; Goldberg 等 人 在 图 顶点 度数 为 常量 的 情况 
T. 在 SIMD 一 EREW PRAM 上 , 曾 建 议 了 一 个 O(log'n) 时 间 、0(n) 处 理 
器 的 算 R, 另外 Hen 考虑 了 平面 图 这 一 特殊 情况 的 MIS 问题 ， 在 SIMD 
一 CRCW PRAM 上 建议 了 一 个 O(log”n) IM], O(n) 处 理 器 算法 ”，He 将 Luby 算法 


一 219 一 


应 用 到 平面 图 上 ， 其 确定 算法 需 O(logn”n) Mi]. O(n^) 处 理 器 ， 因 而 He 算法 在 平 而 图 
情况 下 改进 了 Luby 算法 使 用 的 处 理 器 数 . 
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第 十 二 章 ”图 着 色 的 并 行 算法 


图 着 色 问题 是 指 对 无 向 图 顶点 或 边 进行 着 色 ， 使 得 相 邻 的 顶点 或 与 同一 个 顶点 关联 的 
边 着 不 同 颜色 且 整 个 图 用 尽 可 能 少 的 颜色 。 这 一 问题 具有 广泛 的 应 用 背景 ， 如 任务 调度 ， 
资源 分 配 ，VLSI 布线 和 测试 等 ， 都 可 归 约 成 为 图 着 色 问题 。 因 此 ， 在 图 论 应 用 中 图 着 色 
问题 一 直 爱 到 广泛 的 重视 。 近 年 来 ， 随 着 并 行 处 理 技术 的 进一步 发 展 ， 人 们 研究 出 许多 图 
的 并 行 着 色 算法 ， 本 章 我 们 将 介绍 其 中 一 些 有 关 图 的 顶点 及 边 着 色 的 并 行 算 法 。 


12.1 图 的 顶点 着 色 的 并 行 算法 


12.1.1 常数 度 图 的 着 色 算 法 


Goldberg 等 人 12 基 于 SIMD-EREW PRAM 模型 ， 对 顶点 最 大 度数 A 是 常数 的 一 
类 图 ， 建 议 了 一 个 (A+1)- 着 色 的 并 行 算法 ， 他 们 的 算法 需 O(log” mm)? 时 间 、0O(n) 处 理 器 . 
本 节 我 们 介绍 这 一 算法 。 

1. 算法 的 基本 思想 

对 一 个 图 进行 合法 着 色 是 要 使 得 相 邻 顶点 着 不 同 的 颜色 。 具体 来 讲 ， 首 先 给 图 G 顶 
点 赋予 初始 着 色 ， 令 cé G 的 初始 着 色 ， 计 算 c 的 一 种 简单 方法 是 : 把 与 每 个 顶点 相 联 
的 处 再 器 编号 作为 该 顶点 的 初始 着 包 数 ， 这 样 ， 每 个 顶点 » 都 着 了 同 其 它 顶 点 不 同 的 颜色 
cvy 然后 从 初始 着 色 出 发 ， 不 断 洞 整 每 个 顶点 的 着 色 ， 使 整个 图 的 颜色 数 减 少 ， 

算法 的 思想 是 : 对 每 个 顶点 建立 一 个 差异 天 作为 该 顶点 新 的 着 色 。 差异 表 中 含有 它 和 
邻接 顶点 之 间 的 颜色 差别 ， 整 个 算法 就 是 重复 地 构造 各 个 顶点 的 差异 表 ， 不 断 地 改进 顶点 
的 着 色 。 差异 表 中 每 个 元 索 是 一 个 有 序 对 ， 其 中 : 有 序 对 的 第 一 分 量 是 位 置 下 标 ， 它 表示 
顶点 的 颜色 与 它 的 某 个 邻接 顶点 颜色 第 一 次 在 此 位 置 上 不 相同 ; 有 序 对 的 第 二 分 县 是 该 位 
置 的 顶点 差异 表 上 用 二 进 制 数 表示 的 编号 值 。 下 标 可 以 用 一 个 长 为 rlogL1 的 二 进 制 数 表 
示 ， 其 中 工 是 目前 颜色 数 的 十 进 制 长 度 。 由 于 图 的 顶点 最 大 度数 A 是 一 个 常数 ， 因 而 新 
的 着 色 数 的 二 进 制 长 度 为 OlogL). 

下 面 给 出 一 个 使 用 常数 种 颜色 〈 也 许 较 A+1 大 ) 对 常数 度 图 着 色 的 并 行 算 法 . 算法 
工作 如 下 ， 首 先 给 G 赋予 一 个 合法 的 初始 着 色 ， 然 后 对 图 G 循环 地 进行 着 色 ， 每 次 循环 
都 减少 总 的 着 色 数 目 . 对 每 个 顶点 "以 及 ? 的 每 个 邻接 顶点 w， 算 法 找 出 c() 与 c(w) 第 
一 位 不 同 的 下 标 i RT GE SHOW <i, c jm. FEHR eo, ER c(y) 的 第 访 位 
的 值 .因为 初始 着 色 的 合法 人 狂 ， 所 以 这 样 的 下 标 总 是 存在 的 . 

2. 算法 的 形式 化 描述 


Q log x =win{i | log's <2} 
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算法 12.1 VERTEX-COLORING OF GRAPHS WITH CONSTANT DEGREE 
输入 : 无 向 图 的 边 集合 fla 由 | (uv)e Ej 
输出 : 每 个 顶点 ve V AAE CHA Ie() AEE. 
procedure Color__Constant_Degree__.Graph(V); 
begin 
(1) L- flogn!; 
(2) for each v: veV pardo 
2.1) c—PE ID(y  /* PE_ID(W) 是 和 y 对 应 的 处 理 器 编号 * / 
Q2) NO-fw | Ww) CE} 
endfor; 
(3) while L>A [logZ+11 do 
(3.1) for cach v: ve V. pardo 
(3.1.0 for k—1 to (N(v) | do. / * N(vk)fs No k Aot» / 
wy- N(v,k) 
6-1.2) — &*-minfi | e(vis-eQw,. DE 
(3.1.3) b,—c(v,i) 
endfor; 
(3.1.4) for k--iN(v)| to A do 
(3.1.5) 4-0; 
(3.1.6) by-—c(v,0) 
endfor; 
(3.1.7) e(v)-ibinbs-ib, / * 计算 新 疆 色 * / 
endfor; 
(3.2) L-A liogL+11 
endwhile 
end. 


3. 算法 的 复杂 性 分 析 
定理 22.1 在 SIMD-EREW PRAM 上 ， 用 常数 种 颜色 对 一 个 无 向 图 G 进行 着 色 ， 当 图 
的 最 大 度数 A 是 常量 时 ， 算 法 12.1 需 O(log"n) 时 间 、0O(m) 处 理 器 ， 
证 明 由 算法 12.1 可 知 ， 第 (1) 步 需 OC RA: 第 (2.2) 步 因为 G 的 最 大 度数 A 是 
常量 ， 所 以 第 (2) 步 需 ODM, OAH: 第 (3.1.2) 步 涉及 下 标 计算 ， 应 用 Cole 等 人 
技术 9， 这 一 步 可 在 O(1) 时 间 内 完成 ， 其 它 各 步 显 然 至 多 需 O(1) 时 间 、0O(n) 处 理 器 。 

现在 我 们 证 明 第 (3) 步 的 while 循环 体 至 多 执行 O(log" nk. 4 L= rlogn1， 即 处 理 
器 编号 需要 的 二 进 制 位 数 ， 令 L 表示 第 次 循环 后 颜色 代码 的 位 数 。 我 们 用 归纳 法 来 证 
明 : 对 kX=1 时 ， 有 

L,=A [logL+11<2A [log L1 

d MoghL1> flogA1 + 2。 假 定 对 某 个 大 一 1 时 ， 有 


L, ,&€2A floge 


"n Ll 
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Tlog'Llz llogA! 4.2 

那么 ， 
L, =A Mog’ L--11 «A( l'log(2Alog 
因此 ， 只 要 flog*L1> Moghl+2, MAL, «2A llog'Ll. HETA, HERK 
SEL, 减少 ， 直 到 O(log’ n) 次 循环 后 降 到 常数 2A riogA + 21 或 更 小 时 ， 算 法 终止 . 


此 整个 算法 需 O(log "由 时 间 、O(m) AER. 

定理 12.2 算法 12.1 能 正确 地 给 图 GUERE. 

证 明 ”我 们 用 归纳 法 证 明 算法 12.1 能 正确 地 给 G 着 色 。 初始 化 时 ， 每 个 处 理 器 有 一 个 唯 
一 的 编号 ， 因 此 ， 初 始 着 色 是 合法 的 ， 下 面 我 们 证 明 车 在 一 次 循环 前 车 色 是 合法 的 ， 则 执 
行 循环 后 计算 出 的 新 的 着 色 也 是 合法 的 ， 若 在 一 次 循环 之 前 着 色 是 合法 的 ， 那 么 每 对 邻接 
顶点 v 及 w， 至 少 存在 一 个 下 标 ip e0)58 c(w) 在 第 i 位 不 同 。 对 每 一 个 顶点 » 算法 为 
它 构造 一 个 新 的 颜色 可 以 看 作 由 形式 为 <i,, ov, i,) > 的 有 序 对 组 成 的 表 ， 每 个 邻接 顶点 形 
成 一 有 序 对 。 为 了 使 这 些 差异 表 组 成 一 个 新 的 合法 着 色 ， 任 何 两 个 邻接 顶点 ， 及 w 必须 
至 少 有 一 个 不 同 的 有 序 对 。 BER v 构造 的 差异 表 是 


9-7" pA. 1) «2A riog*z3 


(<i, cv» Ah)» . «hb c(v 5)». <i CO, B). c «ip c d4)) 
由 顶点 w 构造 的 差异 表 是 : 
Ge edw, 102 ， «Ps dw jj». co «Pe c(w, ja>) 


Bt k its. Rc) 与 c(w) 至 少 有 一 位 不 同 . 反之 ， 设 对 所 有 DEAS A= 
Je @<ip cfg， 间 > 是 由 ， 构 造 的 差异 表 中 对 应 边 (*， 由 的 有 序 对 ， 根 据 站 的 定义 ， 
ov. Hew, j) Maj, RE, cv diguec(w, 大 )。 故 每 对 邻接 顶点 ， 构 造 出 的 
差异 表 总 是 不 同 的 . 

应 该 指出 的 是 ， 上 述 建议 的 算法 不 仅 解决 了 求解 无 向 图 的 着 色 问 题 ， 实 际 上 ， 它 引 
入 了 一 种 新 技术 一 破 对 称 技术 (Symmetry Breaking Technique), KARRAS ANE 
EY. ES 


12.1.2 常数 度 图 着 色 算 法 的 应 用 


前 面 介绍 的 着 色 算法 可 应 用 到 求 无 向 图 的 极 大 独立 集 问题 ， 这 里 再 描述 一 个 求 极 大 独 
立 集 (MIS) 的 并 行 算法 ， 它 将 调用 着 色 算法 12.1, 


算法 12.2 MIS OF GRAPH WIIH CONSTANT DEGREE 
输入 : 无 向 图 G(VLE) 
输出 : AKLE ISV. 
procedure MIS. Constant Degree. Graph (V, I); 
begin 
(0 PF-à Aey; 
(2) call Color Constant Degree Graph(Vj / * 调 用 着 色 算 法 12.1* / 
(3) while 43 do 
(3.1) P-Ív»| veA and c(v) is same}; 
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JOA PRE BE MER TEMA 
(3.3) A«-A~(FUN(T)); 
(33) r-Ior 
endwhile 
end. 


定理 12.3. YE SIMD~EREW PRAM 上 ， 求 一 个 最 大 度数 人 为 常量 的 无 向 图 的 根 大 独立 
集 ， 算 法 12.2 88 olog niti. Omak 
证 明 ”由 算法 122 可 知 ， 第 (D 步 需 O(D 时 间 及 处 理 器 ; 第 人 2) 步 由 定理 12.1 可 知 ， 需 
OUog "由 时 间 、0(m 处 理 器 ; 整个 第 (3) 步 的 while 循环 体 执行 次 数 完全 由 图 的 着 色 数 决 
A. 因为 图 G 仅 用 了 常数 种 颜色 着 色 ， 所 以 while 循环 执行 0(1) 次 ， 在 while BHAA, 
RGD G.395& O(1D) 时 间 、0O(m) 处 理 器 ， 因 此 计算 无 向 图 怠 的 MIS $$ O(iog "站 时 间 、 
O(n) 处 理 器 。 

现在 我 们 利用 算法 12.2， 给 出 一 个 度数 最 大 为 A 的 无 向 图 的 顶点 着 A+1 种 颜色 的 并 
FRE, AH 着 色 算 法 的 形式 化 描述 如 下 : 


算法 12.3 COLOR-A*1-GRAPH WITH A-DEGREE 
输入 : 最 大 度数 A 是 常量 的 图 边 集合 和 (wv)| uve V; 
输出 : 每 个 顶点 ve V XY — 3E B eo) Hc(v)| < A1. 
procedure Color. (A1) Graph (V,E); 
begin 
0) AsV; 
(2) while 44 do 
(2.1) call MIS. Corstant Degree Graph(A,I); 
(2.2) Coloreach vel with a new color; 
(23) A<A-I 
endwhile 
end, 


上 面 的 算法 显然 能 对 G 进行 (A+H 着 色 。 因 为 在 算法 12.3 中 每 次 循环 即 找 出 输入 图 的 极 大 
独立 集 并 对 了 工 内 项 点 用 新 的 颜色 着 色 ,: 然后 把 7 从 原 图 G 中 删除 。 若 一 个 顶点 ， 在 某 
次 循环 后 没有 被 删除 掉 ， 那 么 它 的 邻接 项 点 至 少 有 一 个 在 这 次 循环 中 被 删除 了 。 因 此 ， 在 
每 次 执行 循环 后 ， 由 剩余 顶点 导出 的 子 图 的 顶点 最 大 度数 至 少 减少 1， 所 以 ， 至 多 Ast 
次 循环 后 算法 终止 ， 结 果 给 出 图 G 的 一 个 (A+H) 着 色 。 

定理 12.4 在 SIMD—EREW PRAM 上 ， 对 一 个 最 大 度数 A 是 常量 的 图 G(V,E), |V| 9n 
进行 (A+1) 着 色 的 并 行 算法 12.3， 需 Ofiog mite Omak. 

证 明 由 于 算法 12.3 的 while 循环 体 至 多 执行 (A+1) 次 ， 而 每 次 调用 极 大 独立 集 算法 需 
Odog "及 时 间 、O(n) 处 理 器 ; 第 (2.2)~ (2.3) 步 需 O(1) 时 间 、O(n) 处 理 器 。 因 此 整个 算法 需 
O(log" nyf Bl. O(m) t ERSE. 
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12.1.3 平面 图 5- 着 色 并 行 算法 


一 个 图 G， 若 能 把 它 画 在 平面 上 ， 且 除 端 点 外 任意 两 条 过 均 不 相交 ， 则 称 G 是 可 以 
WA (Embedding) BB). WR-TH GBM ARATE, IRA G 为 可 平面 图 (Planar 
Graph)， 可 平面 图 在 平面 上 的 一 个 嵌 人 称 为 一 个 平面 图 (Planar Graph)。 如 图 12.1 所 示 ， 
(@) 所 示 的 图 G 是 一 个 可 平面 图 ，(5) 所 示 的 图 GE G 的 一 个 平面 嵌 人 ， 即 平面 图 . 


人 "TRI G e) FAA 
121 GERBER WEE A] 


设 G 是 一 个 平面 图 ， 图 的 边 所 包围 的 一 个 区 域 ， 其 内 部 既 不 食 图 的 顶点 也 不 含 图 的 
边 ， 这 样 的 区 域 称 为 G 的 一 个 面 (Face)。 面 的 边界 就 是 包围 该 面 的 诸 边 所 梅 成 的 回路 。 

设 GUO,EJÉ— T YEXGC HE, Hl|v|-n,]E 2 m. WA m«3n—-6. 

设 G(EJE— GRIPE ER, $ cw) 是 顶点 veV 的 颜色 ,对 WSV, > eww 
内 着 色 顶 点 所 着 颜色 的 集合 。 由 颜色 a 及 颜色 p 的 顶点 导出 的 子 图 记 为 Ge NOM v 
的 邻接 顶点 集 ，N(V)= duae E). 4 dly) 表 示 顶 点 v 的 度数 。 

首先 我 们 介绍 Naor 给 出 的 一 个 简单 算法 自在 SIMD-EREW PRAM 上 ， 他 建议 
了 一 个 Oleg 站 时 间 、O0a) 处 理 器 的 并 行 算法 。 
1.。 算法 的 基本 原理 

Naor 算法 主要 利用 了 平面 图 一 些 特殊 性 质 ， 下 面 我 们 介绍 这 些 性 质 。 
引 理 12.1 设 G(Y, 忆 是 一 个 无 向 连通 平面 图 ， 且 |Y1=n， 则 G 中 度数 小 于 7 的 顶点 数 大 
于 n/ 6. 
证 明 车 G 中 度数 小 于 7 的 顶点 数 <n/6， 则 G 的 度数 之 和 至 少 为 n/ 6+7x 
5n/ 6= 6n， 而 平面 图 的 度数 之 和 至 多 为 6n-12， 这 导致 矛盾 ， 故 引 理 成 立 。 
引 理 12.2 B G(V,) 是 一 无 向 连通 平面 图 ，U 是 度数 小 于 7 的 顶点 集合 ， 则 由 导出 的 
FE GUE MRA SE 4E I， 其 规模 至 少 为 IU| / 7. 
WEB] 对 号 中 任 一 顶点 veU, Eve I， 则 v 是 极 大 独立 集 了 中 某 个 顶点 的 邻接 顶点 ， 因 
此 N> /7. 

上 面 两 个 引 理 导 出 了 平面 图 的 一 个 ?- 着 色 算法 。 由 引 理 12.1 可 知 ， 若 每 次 从 平面 图 
中 删除 度数 小 于 7 的 顶点 ， 则 删除 的 顶点 个 数 是 整个 图 顶点 数 的 常数 偿 。 因 此 ， 经 过 
Ollogn) 次 删除 后 ， 原 来 的 图 将 成 为 至 多 含 一 个 顶点 的 图 ， 引 理 12.2 告诉 我 们 ， 由 度数 小 


外 常数 因子 大 于 0 小 于 1. 
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于 7 的 顶点 导出 的 子 图 ， 其 极 大 独立 集 大 小 是 整个 图 顶点 数 的 常数 倍 ， 因 此 经 过 O(logn) 
次 计算 剩 下 的 图 的 极 大 独立 集 ， 可 以 变 为 至 多 含 一 个 顶点 的 独立 集 。 而 航 大 独立 集 内 的 项 
点 是 可 以 着 同一 种 颜色 的 . 

2. FBR 和善 色 并 行 算法 


算法 12.4 VERTEX COLORING OF PLANAR GRAPHS WITH 7-COLORS 

输入 : 图 G ARE 4; 
输出 : 每 个 顶点 vev Hse cfr), Ale(V<7. 

procedure Seven Coloring (V); 
begin 
(0 天 一方 
Q) while VQ do 
(3) Uv» | dv) «7, ve V} 
(4) find a maximal independent set 7 of graph G[U]; 
(5 call Seven | Coloring (V'-Uu N(U)); 
(6) set c(v), vel, d(v) € 6, so that c(v):e(w), (vw)e E; 

endwhile 

end. 


定理 12.5 在 SIMD-EREW PRAM 上 ， 对 一 平面 图 GUE) [Vian 进行 7- 着 色 算法 
12.4， 需 Ologinni OAE. 
证 了 明 由 引 理 12.1 ETAT, zd Seven. Coloring 需 递 归 O(logn) 次 。 又 由 定理 11.8 知 ， 每 
次 递归 时 执行 第 (4) 步 至 多 需 O(log>m) 时 间 、0O(m) 处 理 器 ; 而 第 (6) 步 仅 需 0(1D) 时 间 、O(n) 
处 理 器 ， 因 此 ， 整 个 算法 需 OQog)Bi]. OG? Abe. 

在 给 出 平面 图 的 9- 着 色 算法 之 前 ， 我 们 先 证 明 一 个 重要 定理 。 
定理 12.6 ”任意 给 定 的 一 个 平面 图 G(LE, |V|-s. Elm. H VEE, RATES 
种 颜色 ， 
证 明 对 顶点 数 ”用 归纳 法 证 明 . 

(a) 当 n« 5 时， 定理 显然 成 立 。 

(b) 假定 n = k(k > 5) 时 定理 成 立 ， 现 考察 4 = 十 1。 因为 IV| >5， 所 以 至 少 存在 一 个 
顶点 veyV， 且 dv) 5。 如 果 不 是 这 样 ， 由 于 | 恒 =m， 
SIDE Y dv) = 2m, NAV) = n 和 和 d(v) > 6. f Yao) 


之 6n， 故 m > 3n > 3n-6， 与 平面 图 性 质 矛盾 。 因 此 在 
G 中 一 定 存在 一 个 顶点 vB dW)<5， 从 G 中 删除 v. 
则 根据 归纳 假定 ， 对 图 G[V-{y} 定 理 成 立 。 再 把 vy 加 
到 c-r. Æ a)« 5. WS v MBM AK < 
4, AMA-AAA OREM AS v 着 色 ， 得 出 一 个 
图 122 lv|=6, do)= 35 的 着 色 图 5- 色 图 G。 
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35 dt)= 5, BH BENT ARRAN v ve w ve vs ENDER 
fcs cp cp co cy WME 12.2 所 示 。 > H CYP RAS ci 与 c3 色 的 顶点 集合 
图 中 的 E (vs nh FY GIA o Bo, 色 的 顶点 集合 .图 中 的 F=f va. 

车 与 妃 属 于 顶点 集合 开 所 导出 子 图 的 两 个 不 同 连通 分 支 中 ， 将 mW 入 所 在 连通 分 
支 中 的 颜色 对 调 ， 并 不 影响 GIV-{v}] 的 正常 着 色 ， 具体 地 讲 ， 设 w 所 在 的 连通 分 支 中， 项 
AREA b v, 所 在 集合 为 fvit S H RIRE fr1} 的 颜色 置换 成 v, H3 
E RE n 的 着 色 为 cy。 然 后 在 » 上 着 色 ci， 否 则 在 v 上 着 色 co. WG IE sc tutt. 

WR v, 5 v, MERA 吾 所 导出 子 图 的 同一 个 连通 分 支 中 ， 那 么 从 w 到 为 必 有 
一 条 路 径 P，P 上 的 每 个 顶点 都 是 着 cl 色 或 6 色 。 该 路 径 与 边 (wz0 和 边 {*m) 一 起 构成 一 
条 回路 L， 工 包围 了 汶 或 ww， 但 不 能 同时 包围 区 入 教 声 与 4 分 别 属于 顶点 集 F 所 
导出 子 图 的 两 个 不 同 连通 分 支 中 。 同 理 在 包含 n 和 vg 的 连通 分 支 中 将 颜色 对 调 并 不 影响 
G[f 的 正常 着 色 ， 比 如 将 n AREE cy， 这 样 顶点 与 v 都 着 cL 色 ， 故 对 ?着 cy 
色 ， 即 可 对 G 进行 5- 色 着 色 。 

现在 讨论 如 何 将 GC EYE BUSCA, 7 降 至 5 以 及 如 何 将 5- 着 色 从 G-T 扩 展 到 图 G。 # 
顶点 ， 的 邻 集 NORAD T 5 种 颜色 的 着 色 ， 则 剩 下 的 一 种 颜色 可 以 对 ， 着色。 否则 ， 因 为 
G-7 是 9- 着色 的 ， 故 N(W 正 好 车 了 5 种 颜色 。 又 因 G 的 颜色 数 是 7， 所 以 ， 最 多 只 有 6 个 
邻接 顶点 ， 于 是 "的 邻接 顶点 中 至 少 有 4 个 顶点 wo wp w v BAW, (<i aay 
的 任何 其 它 邻接 顶点 着 不 同 颜色 ， 由 定理 12.5 可 知 ， 在 这 四 个 顶点 中 ， 存 在 一 对 着 
x， 有 颜色 的 顶点 ， 它 们 属于 Gu, 的 两 个 不 同 的 连通 分 支 中 。 我 们 通过 v 首先 确定 出 
WWW Wa 然后 确定 这 四 个 顶点 中 哪 一 对 着 x，8B 颜色 ， 令 其 分 别 属于 Gog 的 不 同 连 
通 分 支 中 〈 若 这 样 的 顶点 对 不 止 一 对 ， 则 任 取 一 对 ) .由 于 仅 有 10 种 颜色 对 ， 故 必 有 
一 对 顶点 着 色 a, p 且 其 邻接 顶点 着 这 两 种 颜色 的 未 着 色 顶 点 数目 至 少 为 | 有/ 10。 设 邻 
接 顶 点 着 x， 颜色 的 未 着 色 顶 点 集 为 了 且 |] =k. 每 一 个 着 a 或 了 色 的 顶点 将 由 它 所 
在 Gu, 的 连通 分 支 标识 。 若 在 与 ve J 邻接 的 两 个 顶点 在 Gus 的 两 个 连通 分 支 中 ， 仅 将 其 
中 一 个 的 a，8 颜色 对 调 ， 结 果 给 v 留 下 一 种 空闲 的 第 5 种 颜色 

为 确定 在 哪个 连通 分 支 中 可 以 将 a. PREM, RNS H. H 
中 的 顶点 C, 是 Gas 中 的 一 个 连通 分 支 HI 中 有 一 个 顶点 "同时 与 C 及 C, 相 连接 ， 
则 顶点 Ci。Cj 之 间 有 边 相 连 (J 中 每 个 顶点 恰好 与 Gy 的 两 个 连通 分 支 邻接 )]， 因 此 ， 
HbA k 43H. 显然 ， 多 重 图 五 是 一 个 平面 图 ， 我 们 可 以 用 7 种 颜色 对 之 并 行 着 色 。 
着 同一 种 颜色 的 各 连通 分 支 是 独立 的 。 可 以 对 这 些 连通 分 支 内 顶点 的 着 色 同 时 进行 对 
调 。 吾 中 顶点 度数 之 和 为 2k， 因 此 至 少 存在 着 一 种 颜色 的 顶点 度数 之 和 为 2k/ 7。 由 
此 可 见 ， 了 中 能 自行 着 色 的 顶点 数目 是 了 中 顶点 数目 小 于 1 的 常数 倍 ， 

3. 算法 的 形式 化 描述 


算法 125 VERTEX COLORING OF PLANAR GRAPHS WITH 5-COLORS 
BA: 无 向 连通 平面 图 CV, E 6 ARIETE TE; 
输出 : 对 每 个 顶点 vy e V 着 上 一 种 颜色 dv). IBARRA EURO, MOKA ESAS. 
procedure Five Coloring (V); 
begin 
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(1) while Veo de 
(2) .U-—ív | dv) «7, ve V; 
(3) find a maximal independent set 7 of graph GIU) 
(4) cal Five. Coloring (V-(Io N(M); 
( 引 ) /A* 将 5 着 名 扩充 到 删除 的 顶点 集 * / 
(5.1) 对 每 个 vel, X (NON <5, MEVA- PEAME VEE, SOK: 
(5.2) while (ve) and c()-0 do / *clv)=O RK vie / 
(5.2.1) 工 中 每 个 未 着 色 顶 点 上 确定 一 对 不 属于 Gu 的 同一 连通 分 支 的 顶点 
(Pelt y 2548); 
(5.2.2) 令 wu， 月 为 这 样 一 个 颜色 对 ， 它 至 少 被 了 中 国 / 10 未 着 色 顶 点 选用 ， 
用 J 表示 选用 m，B 的 未 着 色 项 点 集 ， 且 令 | 开 = 此; 
(523) E$ ERHET: 顶点 Ci 是 Gop 的 一 个 连通 分 支 ， 若 了 中 存在 
一 个 顶点 veJ, v 5 CI 及 Cr 相连 ， 则 C, 5 C, TMA: 
(5.24) call Seven Coloring((C, |C, % G,, 的 一 个 连通 分 支 }); 
(5.2.5) AH Pik Rape E 2k/ 7 的 着 同一 颜色 顶点 全 gs 
(5.2.6) 在 Gg 中， 将 属于 8 的 连通 分 支 中 的 x，B 闫 色 对 调 ; 
(5.2.7) 结果 每 个 ve， 存在 一 空 用 颜色 对 之 着 多 
endwhile 
endwhile 
end. 


定理 12.7 在 SIMD-EREW PRAM 上 ， 对 一 个 无 向 平面 图 5 着 色 的 算法 12.5, % 
Ollog*n) Tf]. O(n Ab EEE, 
证 明 ”由 算法 12.5 可 知 : 第 (4) 步 的 递归 调用 需 执行 O(logn) 次 。 而 第 (5. m omi} 
B, OMER, 第 (5.2.0 步 应 用 并 行 求 连通 分 支 的 算法 43， 需 Ologinni. Oye 
器 ; 第 (5.2.2) 步 可 用 Cole 排序 算法 实现 ， 每 个 未 着 色 顶 点 "形成 一 个 或 多 个 三 元 组 (wz 有 )， 
其 中 x，8B 是 它 的 邻接 顶点 所 着 的 颜色 ， 然 后 以 (a,8) 为 关键 字 排 序 ， 计 算 排 序 后 最 长 的 区 间 
内 的 顶点 即 为 了 的 成 员 ， 这 一 步 需 O(logn) 时 间 、O(n) 处 理 器 ， 第 (5.2.3) 步 仅 需 0(1) 时 间 、 
0 全 处 理 器 ; 由 定理 12.5 知 ， 第 (5.2.4) 步 需 Ologinni, Op AES, 88524) (52:795 
TOMER OCHS 而 (5.2.0) 一 (5.2.7) 至 多 执行 O(logm) 次 ， 由 定理 11.8 A, BOE 
需 0Otog 由 时 间 、0O(m9 处 理 器 。 因 而 整个 算法 需 C(log2 时 间 、O09) 处 理 器 。 
推论 12.1 在 SIMD-EREW PRAM 上 ， 对 一 个 无 向 平面 图 5- 着 色 需 O(log'n)Bt i. 
O(n? Kb RE. 
证 明 对 算法 0124 及 算法 12.5 中 求 极 大 独立 集 算法 换 用 Goldberg 算法 ， 由 定理 11.9 
知 ， 计 算 一 个 4 个 顶点 无 向 图 的 极 大 独立 集 需 O(log 时 间 、O{ntm) 处 理 器 ， 因 而 5 着 
GAEE O(log"D) 时 间 、O(xtm) 处 理 器 . 
推论 12.2 在 SIMD-EREW PRAM 上 ， 对 一 个 无 向 平面 图 进行 5- 着 色 ， 涡 O(logm) 时 
f. ODER. i 

证 明 ARSON TRE A EEPE, A He 的 平面 图 极 大 独立 集 

一 228 一 


算法 ( 见 本 书 第 11 章 参考 文献 [12)， 在 .SIMD-CRCW PRAM 上 ， 求 ”个 顶点 平面 图 
的 极 大 独立 集 需 00og25) 时 间 、0( 处 理 器 ， 它 可 在 OQog mit iS AE OQ Ab ERE f 
SIMD-EREW PRAM 上 模拟 实现 ， 因 而 平面 图 5- 着 色 需 O(log nts. OC ALBEE. 


12.1.4. 平面 图 5- 着 色 最 优 的 并 行 算法 

Hagerup 等 人 中 基于 SIMD-EREW PRAM 模型 建议 了 一 个 O(logmog "可 时 间 、 
O(n / logn .log "中 处 理 器 的 平面 图 5 着 色 最 优 的 并 行 算法 。 本 节 我 们 将 介绍 这 个 最 优 笋 法 。 

1， 一 些 基本 概念 

dE G(V, 忆 是 一 个 简单 无 向 图 ,对 wveV 目 (uy E. wily GE (Identification) 是 一 
种 操作 ， 此 操作 用 一 个 新 顶点 z 替换 掉 u 及 v 和 它们 在 图 中 关联 的 边 ，z 恰 与 Vfu,v} 中 那 
些 在 原 图 中 同 x 和 y 关 联 的 顶点 关联 .多 于 两 对 不 邻接 顶点 的 粘 合 可 类 似 地 定义 ， 或 看 成 两 
个 项 点 粘 合 的 多 次 应 用 ， 当 C 是 一 个 独立 集 时 ， 我 们 用 <C> 表示 C 中 所 有 顶点 的 粘 合 。 

所 谓 图 G 的 一 个 平面 图 嵌入， 是 一 个 函数 Y, ARAH G 的 顶点 映射 到 RO 内 的 不 
BAE, BG 的 每 条 边 e= (u,vjeE RHR R 内 的 一 条 车 当 (Jordan) 曲 线 ， 该 车 当 曲 线 是 
BA PDR POR, IEE RA e= (wvjeE， 它 满足 : 

Ve) E(7)oN (E — fe) E fP(u), PO)} 
即 若 GETHRA, RUG 映射 到 平面 的 曲线 不 相交 。 

设 G 的 一 个 平面 庶 人 是 Y, HEA we V， 其 邻 集 为 Nw)= fuis), DUBIE FOr) 
的 若 当 曲线 Pwu) e Pw DE EHIE (Cyclic Order) 出 现 ， 即 以 着 时 针 
方向 围绕 里 (w) 扫 描 时 它们 所 上 出现 的 次 序 。 可 简单 地 说 ， 在 平面 谋 人 平 内 w 的 邻接 项 点 按 
环形 次 序 ww,…, 围绕 w 出 现 . P 的 一 个 着 当 上 曲面 是 ROT P(VO EYE 7 EXEC, 

下 面 讨论 无 向 平面 图 G(V,E) 的 5- 着 色 最 优 并 行 算法 . 

2 算法 的 基本 原理 

Hagerup 等 人 建议 的 5- 着 色 最 优 并 行 算法 ， 其 基本 思想 是 : 算法 始 于 一 个 平面 图 
Go=G， 随 后 的 各 个 连续 阶段 ， 算 法 产生 一 个 平面 图 序列 Go Gy Gr 0e Gp …， 每 
4G, 的 大 小 至 多 是 它 的 直接 前 趋 (i> 1) 的 大 小 的 以，0< c< 1 且 是 常数 . 因此， 经 过 
O(logm) 个 阶段 后 ， 对 剩 下 图 的 着 色 是 一 件 非 常 简单 的 事 . . 

对 i20, Ga 是 G4 的 顶点 经 过 许多 次 归 约 (Reduction) 得 来 的 ， 所 谓 顶 点 w 的 归 约 ， 
是 指 删除 w RUE w 的 一 些 邻 接 项 点 。 

设 w 是 G 的 一 个 顶点 . 车 我 们 粘 合 w 的 足够 多 的 邻接 顶点 ， 使 w 的 度数 降低 到 至 多 
为 4， 令 得 到 的 图 为 G， 则 将 图 G 汪 fw} 的 5- 着 色 扩展 至 图 G 的 5- 着 色 是 一 件 容易 的 
F. PARKER w 的 邻接 顶点 的 精 合 ， 令 在 这 一 过 程 中 创建 的 每 一 新 顶点 维持 它 的 颜色 。 
然后 将 w 烙 回 到 原来 的 位 置 ， 根 据 上 述 着 色 约定 ，w 的 邻接 顶点 至 多 着 4 色 ， 因 此 第 5 
种 颜色 可 用 于 对 w 着 色 . 

为 了 使 得 Go 是 可 5- 着色 的 。 我们 必须 保证 它 仍 是 一 个 平面 图 。 进 而 证 明 对 每 个 
度数 至 多 为 6 的 顶点 执行 归 约 ， 以 保持 6'-fw} 的 平面 性 ,但 是 象 这 样 的 归 约 是 不 易 确定 
的 。 因 此 ， 我 们 必须 烙 合 足够 大 的 顶点 集 ， 使 得 这 个 顶点 集 可 在 常量 时 间 内 找 出 来 . 

所 有 从 Gi 产生 Gu, 的 妇 约 是 并 行 执行 的 。 归 约 顶 点 集 w 的 选择 必须 倍加 小 心 ， 首 


—229— 


先 ， 它 必须 使 得 Gi 仍然 是 平面 图 ; 其次， 到 内 的 顶点 和 平面 图 Gi 的 项 点， 其 表示 法 必 
须 保持 某 种 独立 性 ; ME, W 的 大 小 应 是 整个 顶点 集 大 小 的 常数 依 ， 这 样 ， 我 们 选择 的 
归 约 顶点 集 W 才 是 所 有 顶点 的 妇 约 ， 且 可 在 常量 时 间 内 完成 - 

给 出 一 个 图 G， 在 G 中 执行 归 约 ， 我 们 形式 地 定义 为 集合 r= foCu…,C4， 其 中 由 是 G 
的 一 个 顶点 ，Cl，-……，C, 是 XU) 中 两 两 不 相交 的 独立 子 集 。 顶 点 w 称 为 集合 1 的 中 心 (Cent- 
名 所谓 执 行 妇 约 ;是 的 指 删除 + 的 中 心 w 且 对 得 到 的 图 使 用 粘 合 操作 < CG >r <C>. 

对 一 个 固定 的 常量 Ko» 12， 若 某 个 顶点 至 多 有 乓 个 邻接 顶点 ， 则 它 是 小 的 (small)， 
否则 称 它 是 大 的 (Large)。 

所 谓 图 G 的 一 个 项 点 w 是 可 归 约 的 (Reducible)， 若 它 满足 下 列 条 件 之 一 : 

(1) dow) <4 ( 即 顶 点 w 的 度数 < 4); 

(2) dw)=5 E w 至 多 有 一 个 大 的 邻接 顶点 ; 

G) dgw)= 6 且 w 的 所 有 邻接 顶点 都 是 小 的 而 Ntw) 导 出 的 子 图 是 一 个 哈密 顿 图 ， 即 

WUw) 生 成 的 子 图 是 一 条 简单 回路 。 
车 下 列 条 件 之 一 成 立 : 

(D dw)s 48 r={w}; 

(D d(9)- 5, XE w WMA MER yh A r= bebo 

(3) dw)-6, RË 

(a) r={w.Cl, BE CE Non) 且 ICI= 3. RH, 
(6) r2 he bs rib IExsyMe MRSA BRR, x, eN) y, eN(o), i=l, 
2. 在 NOVEN TEKER MEM LIEW x, yp xp Y» 
则 称 以 可 归 约 项 点 w 为 中 心 的 归 约 ， 是 安全 的 (Safe)。 

平面 图 的 5- 着 色 并 行 算法 是 并 行 执行 以 可 归 约 

顶点 为 中 心 的 安全 归 约 。 算 法 主要 基 子 下 述 六 个 绰 
3E. 引 理 12.3 证 明了 安全 归 约 的 存在 性 ; 引 理 12.4 

7\/\ RET RAAB MODE; 引 理 125 及 引 理 
“ 12.6 论证 了 可 归 约 顶点 数 是 大 的 ; 引 理 12,7 证 明了 

在 顶点 度数 为 常量 时 ， 求 个 顶点 图 的 一 个 大 的 独立 

集 ， 可 以 在 O(log* mm 时 间 内 实现 ; 由 前 面 诸 条 引 

理 ， 引 理 12.8 最 终 陈述 了 以 可 归 约 顶点 为 中 心 的 、 

图 12.3 Buy Sus Ay BE 具有 常数 偿 个 可 归 约 顶点 的 归 约 ， 可 在 Oog niit 

Ml uy uus HE GEAR HAXA. 

202 123 设 顶点 w 是 平面 图 G 的 一 个 可 归 约 顶点 ， 且 已 知 w 的 邻接 表 和 它 的 小 邻接 项 
点 ， 那 么 存在 一 个 以 w 为 中 心 的 安全 归 约 ， 可 用 一 个 处 理 器 在 O(1) 时 间 内 完成 归 约 . 
证 明 dlw)< 4， 引 理 12.3 BARE. 若 dlw)=5， 则 可 以 标识 w 的 两 个 邻接 顶点 ， 且 它 
们 是 不 相 邻 的 。 显然 这 两 个 顶点 一 定 存在 .不 然 的 话 ，G 将 含 一 个 K; FE, 5 G 是 平 而 
图 矛 导 。 若 d(w)= 6， 令 w 的 六 个 邻接 顶点 分 别 为 W，4,，-…，ww， 且 令 它 们 在 N(w)} 导 出 
WNR RRE EMIRE RKE A tp ug e, uge 

E Ww) 含 有 3 个 顶点 的 独立 集 ， 则 可 以 直接 标识 它们 .否则 我 们 假定 G 含有 边 
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u a) BA G 不 可 能 含有 边 (ul,，us)， 不 然 的 话 ，fuz，te，ue} 将 形成 一 个 独立 集 《 如 
图 12.3 所 示 )。 因 此 fw，fu，ws}，fuw，wa}} 是 以 w 为 中 心 的 一 个 安全 归 约 . 

引 理 124 ”对 平面 图 G 执行 安全 归 约 后 得 出 的 图 G/ 仍 是 一 个 平面 图 。 

证 明 SRS HBR, fx yi xs wh. ÆR G 的 任 一 平面 媒人 内 ， 不 
仅 xi 与 坊 而 且 %% 与 蕊 是 相 邻 的 ， 且 在 围绕 w 的 环形 次 序 上 它们 出 现 的 次 序 为 x yv 
xp y G'HDETÉEXOE 12.4， 其 它 情 况 的 安全 妇 约 不 难 验证 . 


图 12.4 Boxe. fx, vibe (xy xn 


$138 125 GVA), |V|- m |E| 2 m 是 一 个 平面 图 ， A Z={w | dw)23. wey E 

NN(w) 导 出 的 子 图 不 是 哈密 顿 图 }， 那 么 m< 3n7Z / 4. 

证 明 ”考虑 G 的 任 一 平 而 嵌 人 ， 我 们 观察 到 Z 的 每 个 项 点 限制 在 这 个 而 土 ， 它 至 少 含 

四 个 不 向 的 顶点. 现在 对 每 个 这 样 的 面 ， 给 G 加 和信 一 个 新 顶点 uw;， 且 可 入 连接 u, 

与 上 所 有 项 点 的 边 《 若 一 个 顶点 在 边界 上 不 止 一 次 出 现 ， 则 u, 仅 与 其 中 一 个 有 边 相 

3E) ， 那 么 得 到 的 图 仍 是 一 个 平面 图 ， 令 n，m’ 分 别 表示 添加 的 项 点数 及 边 数 ， 显 然 m 

24n' Hm’ 2 |ZI。 再 对 得 到 的 平面 图 应 用 欧 拉 公 式 ， 则 得 (n tm’) «301 en) B 
mant+n—m <3n—m'/4<3n-|2|/4 

引 理 12.6 设 4 是 在 六 个 顶点 的 平 而 图 G. 上 可 归 约 的 便 点 集 ， 闭 么 |4|> n/ 196. 

证 明 令 x 是 G 的 顶点 最 大 度数 。 对 /==0,1,2,…,x. 令 n， RRE G 中 度数 为 的 顶点 

RK. OA, 表示 度数 是 5 的 可 归 约 的 顶点 数 ，n。 表示 度数 是 6 的 可 归 约 的 顶点 数 ，#, 表示 


度数 是 6 且 它 的 邻接 项 点 都 是 小 的 顶点 数目 ， 显 然 郊 , > KIAl= Xn, +Â, +H. 
m 
4:—-6—2m/n. e200, 故 2m — (6s REF nn, -in-(6-2aEn. HER a, 
的 项 分 离 出 来 ， 得 到 
(Qe, = DY -6 +e, +. DU 6 +e, 
ino ins 
所 以 ， 


n,2 X -6t8n,—6n, a) 
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4 m! 是 图 G 中 有 一 个 端点 是 大 的 边 数 。 由 于 RA, EL me An, 8) + (me SR) 


另 一 方面 , m> Si n, Bll, 20,8) c (n,- 8) & Y jin, 或者， 


2A, +A S2, +n Y jin, ` (2) 


jake! 


将 不 等 式 (0) 乘 以 上 = 15/8 加 到 不 等 式 (2) 上 ， 结 果 为 : 


‘ 


2A, +A, > (2-an, tan, 一 È jon ra 6+ en, — 6a >in, 


janet ine j-o 


=n,/8+(1+aen, "M * 5 (x — IK + 1) — 6)n, 一 ex nm 


irt den E 
由 于 (ge 一 1)(K 1) 6x2 178， 因 此 得 
‘ ok m 
PU +2, +â B oer omn ta En, B) 
下 面 考虑 两 种 情况 : 
WRI: s> 17 32， 由 于 me >a, SA 


6 
M n an lš 
Gan, +2 ou 4g h" 


int 


ERBURNI/ a> 8， 并 加 土 Yn. f$: 


=o 
LI ‘ 64 4 * 

193-|4| 2 (6x 3241 Tn, + 8,2 En +n +n, + Ea, =n 
m i no 


2 
引 理 12.6 对 这 种 情况 成 立 . 
情况 IL: 2< 1/32. HUY. m=3n—en/ 2, SIH 12.5 得 : A, ~A, <2en, A 
由 (3) 得 : 


n 12 
> A — <> 一 
Saz n +2, +n, > tatg a, 2en 


m 


A 


(62+ 1)» MI» Dn, +28 StH > (g 202 Te 


故 Alè n/ 16(60 + 0) —n/ 196, 
为 了 下 面 讨论 方便 ， 现 给 出 图 G 的 数据 结构 。 对 顶点 集 V — {1,2 nh, SRE 
点 ze 擅 有 一 个 双向 邻接 链表 ， 链 表 中 的 每 一 结 点 恰好 对 应 u PR, BR TUN 
3i» 的 标识 外 ， 还 含有 一 个 指针 ， 它 指向 "邻接 链表 中 对 应 的 结 点 ， 这 种 指针 通常 称 
为 变 叉 链 (Cross Link). 
引 理 127 设 G(V,E) 是 一 个 个 硕 点 的 无 向 图 EL G 的 项 点 最 大 度数 A 是 常量 ， 硕 点 
的 编号 <q. BAG RDA n/ 6 个 顶点 的 独立 集 ， 这 个 独立 集 可 在 O(log” g) 时间 
内 使 用 On) 处 理 器 计算 出来 . 
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证 明 ”我 们 把 GREATE REKER. WE G 的 每 条 无 向 边 (u,v) 看 作为 两 条 有 向 边 
<wp> 和 <yw>， 对 每 个 顶点 ueV， 指 派 一 个 处 理 器 ， 且 给 1 条 出 边 ， 标 号 为 22-4. > 
到 是 标号 为 7 的 边 集 合 ， 为 了 消除 集合 ,内 的 边 引起 的 冲突 、 可 执行 下 列 程序 段 : 

Vo*-V; 

for -1 to A do 

V r-an independent set in the graph G(V,,, E, (V4, X Vz) with V4 z Vl/ 6 

endfor; 一 

得 到 的 V, 将 是 G 的 一 个 至 少 会 n/ 6t 个 顶点 的 独立 集 。 剩 下 要 证 明 : 在 具有 + 个 顶 
点 且 最 大 出 度 为 1 的 G 的 子 图 G, 中 ， 可 以 在 O(log" 9) 时 间 内 使 用 OGOREREdE, HR — 
个 至 少 会 1/ 6 个 顶点 的 独立 集 。 

考虑 这 样 一 个 子 图 G, EWR G 中 人 度 > 2 的 顶点 ， 则 得 到 的 图 万 是 由 一 些 没有 
公共 顶点 的 简单 路 径 和 简单 回路 组 成 的 而 且 五 至 少 会 1/ 2 个 顶点 。 我 们 考虑 万 中 的 任 
一 简单 回路 和 简单 路 径 ， 内 为 顶点 的 最 大 度数 为 2， 它 是 一 个 常量 ， 应 用 定理 12.3 M, 
寻找 五 的 极 大 独立 集 需 O(log” 9) 时间、O(m) 处 理 器 ; 而 A MR AT ESTER: a 
为 (1 /3Xt/ =1/ 6。 因 此 引 理 得 证 。 
引 理 12.8 设 4 是 a 个 顶点 的 图 GIV,E) 可 归 约 的 顶点 集 ，G 的 顶点 编号 限制 在 0 一 9 范围 
内 。 对 每 个 we 4， 令 rz, 是 以 # 为 中 心 的 一 个 安全 归 约 ， 那么 对 某 个 常数 >0， 安 全 归 约 
集合 fr。 | ue4i 中 至 少 有 yA 个 妇 约 可 在 O(log" 9) 时 间 内 使 用 O(n) 处 理 器 问 时 执行 
证 明 首先 考虑 执行 一 个 安全 归 约 .顶点 x. ox UNO SORTE: 先 选择 一 个 代表 
比如 xs POM xs oo. x OBB MA A erie. ERA x, 邻接 表 中 的 结 点 ， 这 
RER x, oo, o WBE ER, ER x, 的 新 的 邻接 表 即 可 ; RNE x, os xy 
和 在 x, 邻接 表 中 重复 出 现 的 边 ， 由 于 涉及 粘 合 操作 的 顶点 数目 和 它们 关联 的 边 均 为 党 
量 ， 这 一 操作 可 用 一 个 处 理 器 在 常量 时 间 内 完成 。 上 述 的 安全 妇 约 可 推广 应 用 到 删除 一 个 
顶点 w 及 其 邻接 顶点 (至 多 6 个 ). 

为 解决 同时 归纳 可 能 引起 的 归 约 不 正确 性 ， 这 时 我 们 引入 一 个 辅 图 H, 五 是 一 无 
HR, ATARIA CNBR. NRHA 及 ,不 能 同时 执行 。 对 所 有 的 
wyeA H utv, 车 有 下 列 条 件 之 一 成 立 : ` 

(0) 在 G 中 存在 一 条 从 xz Bl v 的 路 径 ， 其 路 径 长 度 至 多 为 4， 且 在 这 条 路 径 上 不 含 大 


T 

(2) ECD TU x 5 y, xetuluN(G), yetrbuNQ), Bx 5i y di AE BE BUS 
w Hw 的 邻接 表 中 ， 对 应 x* 与 》 的 结 点 是 紧 控 在 一 起 的 . 

显然 万 的 最 大 度数 也 是 常量 。 不 难看 到 : 因为 归 约 顶点 的 邻接 项 点 数目 至 多 为 6 H 
都 为 小 顶点 ， 故 条 忻 (2) 可 在 O(1) 时 间 使 用 O(D 处 理 器 完成 判定 ; 至 于 条 件 (D)， 因 为 路 径 长 
度 至 多 为 4， 所 以 也 可 用 O(TD) 处 理 器 在 O(1) 时 间 完成 。 因 而 构造 辅 图 A i oae. O(n) 
处 理 器 .根据 引 理 12.8， 存 在 一 个 常数 ?> 0， 使 得 百 中 大 小 鞭 少 为 ?14| 的 一 个 独立 集 所 可 
在 olog’ q) 时 间 内 计算 出 来 ， 然 后 对 每 个 we W 赋 给 一 个 处 理 器 ， 对 r 同时 执行 归 约 。 我 
们 应 该 看 到 ， 这 同 串 行 地 执行 妇 约 得 到 的 图 是 一 致 的 、 且 在 以 顶点 w 为 中 心 的 归 约 是 在 不 
RMA BH (MARS) 上 进行 的 。 为 说 明 这 一 点 ， 如 果 两 个 处 理 器 PE, 和 PE, 
同时 对 一 个 令 接 表 L 进行 操作 ， 那 么 ， 由 条 件 (1)， 工 必然 是 一 个 大 项 点 的 邻接 表 ，PE Al 
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PE, f£ L EASA ERE eoi HUM BRIE A. dE LP PE, 和 PE, 不 能 同时 删除 或 修 
改 同一 结 点 ， 因 此 ， 修 改 不 会 引起 冲突 。 由 条 件 (2)， 工 其 至 不 含 这 样 两 个 紧 挨 的 结 点 ，PE 
删除 其 中 的 一 个 ，PE2 删除 另 一 个 .因此 涉及 到 重 置 前 趋 及 后 继 指针 的 删除 也 不 引起 冲突 . 
3. 算法 的 形式 化 描述 


算法 126 THE OPTIMAL ALGORITHM OF PLANAR GRAPH'S FIVE-COLORING 
输入 : 无 向 平面 图 G(V,E)， 用 双向 邻接 表 表 示 ; 
输出 : 每 个 顶点 ve AARE cv), Ble(V)I« 5. 
begin 
(0 GoVo, EWG(V, Ey 
{2) kep llogn!; 
(3) for i<-0 to k-1 do 
(3. for each u: uc V, pardo 
Compute the set A; of reducible vertices in G 
endfor; 
(3.2) for cach w: ue A, pardo 
Compute a safe reduction r, centredat u 
endfor; 
(3.3) GaiVa Em) be a graph obtained from G, by parallel executing 
at least y|4, | of the reductions in fr, | ue 4] 
endfor; 
(4) Color graph G,(V,, Ey); 
(5) for i--k-1 downto 0 do 
(5.1) Reconstruct G; from Gay; 
(5.2) Extend the coloring of Ga, to a S—coloring of G; 
endfor 


end, 


其 中 B, ? 均 为 大 于 0 的 常数 ， 在 常量 因子 问题 上 ， 它 们 的 选取 对 算法 效率 的 优 劣 影响 很 大 
定理 12.8 在 SIMD-EREW PRAM 上 ， 对 一 个 平面 图 GUE), |Vl=n |E =m 进行 
5 着色， 算法 12.6 需 O(lognlog "四 时间 、O0) 处 理 器 ， 

证 明 ”我 们 通过 分 析 算法 12.6 的 每 一 步 的 计算 复杂 性 来 给 出 它 的 复杂 性 .算法 的 输入 是 
平面 图 G 的 邻接 表 ， 为 了 使 得 G 以 双向 链表 表示 且 有 交叉 链 存 在 ， 可 以 使 用 Tarjan 的 方 
法 对 边 进行 排序 来 实现 . 这样， 形成 G 在 算法 中 的 数据 结构 需 O(logn) 时 间 、O(m)= O(n) 
处 理 器 ; 算法 的 第 (了 ) 步 需 ONNA, OMAE 第 (2) 步 仅 需 O(1) 时 间 及 处 理 器 ， 由 引 
理 12.3 知 ， 第 (3.1)、(3.2) 步 需 0(1) 时 间 、0(m) 处 理 器 ; 由 引 理 12.8 知 ， 第 (3.3) 步 需 
O(log!’ n)= O(log” mn) 时 间 、0O(m) 处 理 器 。 故 整个 第 (3) 步 需 O(lognlog" nit E. Oln) 
OE, AFI, «IV, - v4, s (1 一 yA196)IV |, i= 0,1,…。 适 当地 选择 常 
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HB. EV <i. AMBRE O, ED 的 着 色 非 常 简单 ， 因 此 第 (4) FELE ON) 
时 间 、O(m) 处 理 器 ;第 (5) 步 类 似 第 (3) 步 ， 故 同 第 (3) 步 有 相同 的 计算 复杂 性 ， 从 Ger 着 色 
扩展 到 G 着 色 可 在 O(1) 时 间 内 使 用 O(n) 处 理 髓 完成 。 因 此 ， 整 个 算法 的 时 间 复 杂 性 为 
O(lognlog" n) ”处理 器 复杂 性 为 0(m)。 注 意 ， 当 一 个 顶点 z 被 分 裂 成 两 个 顶点 x 和 y 时 ， 
x 和 上 继承 顶点 z 的 颜色 。 当 一 个 顶点 w 被 重新 加 和 人 到 图 中 时 ， 因 为 w 的 邻接 顶点 至 多 
用 4 种 颜色 着 色 ， 因 此 至 少 还 有 一 种 颜色 可 供 w 着 色 。 显然 从 Gi 着 色 扩 展 到 G 着 色 是 
一 件 非常 容易 的 事 ， 为 了 避免 引起 读 冲 突 ， 每 条 边 的 端点 必须 带 上 它 的 颜色 . 

定理 12.9 在 SIMD-EREW PRAM 上 ， 对 一 个 无 向 平面 图 OV AER 5- 着 色 ， 可 在 
O(lognlog "站 时 间 内 使 用 O(n / loglog "相处 理 器 完成 - 

证 明 构造 G 的 双向 邻接 链表 ， 在 使 用 O(n / lognlog" ) 处 理 器 时 需 O(logalog* n) 时 间 . 
因为 对 G 的 边 进行 排序 不 能 在 0(lognlog" n) 时 间 完 成 ， 所 以 采用 另 一 种 简单 方法 构造 交 
叉 链 ， 我 们 在 每 个 邻接 表 上 执行 表 计 数 算法 加， 一 旦 过 到 顶点 v 的 邻接 表 中 的 对 应 邻接 项 
点 # 时 ， 将 指向 它 的 指针 值 置 人 Tu, 单元， 这样， 计算 所 有 交叉 链 筑 O(ognlog? nfi]. 
O(n / lognlog" nb SESS; 再 对 算法 12.6 的 处 理 器 谨慎 地 分 配 ， 比 如 用 Cole 等 人 的 元 素 近 
似 均匀 分 配 算法 54 实 现 ， 则 这 种 分 配 需 CO(logm) 时 间 。 且 每 一 阶段 使 用 的 处 理 器 数 是 按 几 
何 级 数 下 降 的 。 结果， 我 们 得 到 一 个 无 向 平面 图 5- 着 色 的 最 优 算法 ， 此 算法 需 
O(lognlog" nti, O(n/ lognlog" náb IERE. 


12.2 图 的 边 着 色 的 并 行 算法 


在 上 一 节 中 我 们 介绍 了 图 的 顶点 着 色 算 法 ， 这 一 节 我 们 将 介绍 边 着 色 的 并 行 算法 。 

一 个 图 的 边 着 色 是 对 所 有 边 给 予 着 色 ， 使 得 共用 一 个 顶点 的 多 条 边 着 不 同 的 颜色 ， 而 
且 希 望 使 用 尽 可 能 少 的 颜色 .给 定 一 个 无 向 图 G(V,E)， 对 它 的 边 进行 着 色 的 最 少 颜 色 数 
Buit Chromatic 数 ， 记 作 r(G). 4 G 的 顶点 最 大 度数 为 4， 显然 X(G)>A。 然 而， 
Vizingm 证 明了 : 3$ G 是 一 个 简单 图 ， 则 y'(G)« A+1。 3$ G 是 一 个 多 重 图 (Multigraph)， 
Shannon E E T x(G) <3tA/ 21. 


1224 树 的 边 着 色 并 行 算法 


Gibbons 等 人 中 基于 SIMD-CREW PRAM 建议 了 一 个 对 树 边 着 色 的 快速 并 行 算 
法 。 这 里 将 介绍 他 们 的 算法 ， 

BARAT PR AMRARR. RA ARME O=[0, 1, 2, +, ATT 
进行 着 色 。 令 xeQ，yeQ， 定 义 环 和 x@y=(xty) mod A， 则 有 下 面 的 引 理 。 
引 理 129 对 任 一 元 素 xeQ， 则 Q 中 的 A 个 元 素 x, OL x2, «+, x@(A-1) HAA 
Al. 

证 明 ”假定 存在 元 素 x@i-x@si Hi<j. i jeft, 1, = Al}, MERRE” O” E 
X xGi-r: Atk, xj —5* Atk, [RA id 所 以 es MRF xx 因此 ， 
x, xG1, x92, =, xA- DAR. 


一 235 一 


1 工法 的 基本 原理 
有 关 树 并 行 计 算 的 一 个 通用 技术 ， 就 是 在 第 八 章 介绍 的 Tarjan SA RM KARR 
珊 技 术 。 利 用 这 一 技术 ， 我 们 将 树 了 以 一 个 顶点 为 根 的 有 向 树 形式 存 贮 ， 对 每 个 项 
点 ， 我 们 知道 它 的 父亲 和 儿子 、 对 树 根 附加 一 条 入 边 且 对 这 条 边 着 色 为 0， 其 它 每 个 项 
Ar RE REAM < FO (FW 是 v 的 父亲 ) 和 至 多 A-1 条 射出 边 . 我 们 对 v 的 
所 有 射出 边 用 行 ，…，A 一 } 中 的 不 同 元 素 分 别 给 予 着 色 。 设 cs(w) 是 从 根 开始 《包括 根 
的 人 边 ) 到 达 ， 的 路 径 上 所 有 边 着 色 的 @ 和 。 对 每 个 顶点 »， 我 们 对 它 的 进入 边 
-<P> EE, csv), BI FO) eeso). HI 12.9 可 知 ， 这 种 对 树 T XLI AE GE 

法 基 - 一 个 合法 的 边 着 色 方法 。 
2 算法 的 形式 化 描述 


算法 12.7 EDGE COLORING OF TREES 
输入 : BET (VEO RR, 
输出 : BET ORR ee E RS E cle), RP O<cle)<A. 
procedure Edge-Coloting of Trees(V,E); 
begin 
{1D)(1.1) 调用 算法 8.5， 首 先 将 工 变 成 一 个 有 向 欧 拉 图 ; 
02) 对 每 个 顶点 的 射出 边 着 属于 和 1，2，…，Ai 中 互 不 相同 的 颜色 ， 设 着 色 数组 
为 label; 
03) 遍历 有 向 欧 拉 图 ， 仿 遍历 后 的 表 为 工 = (el，…，eam)， 工 的 每 条 无 向 边 
(FO) VAL PHRAA, RF) v» 和 < Fo): 
(2) 对 工 中 的 另 一 些 边 同时 进行 着 色 ， 即 ; labely, F(v))-——label(F(v), v); 
/* 边 <Flv),r> 已 在 (1.2) 步 进行 了 着 色 。 任何 回路 上 的 label $$ "09" 4 0 / 
(3) for cach v: veV pardo 
es(v)*-label(e;Glabel(e;) @---@label(e,) 
endfor; 
for each v: veV pardo 
e((F(v), v))--cs) 
endfor 
end. 


(4 


定理 12.10 在 SIMD-CREW PRAM Lb. XI— EAE TOLE) |V| 9n. [E| 7 m 的 边 着 
色 ， 算 法 127 f O(logn) 时 间 和 O(n) 处 理 器 . 

证 了 明 根据 算法 12.7 可 知 ， 第 (1) 步 由 定理 8.7 需 O(logm)= O(logn) 时 间 和 O(ntm)= O(n) 
处 理 器 (m= O(n)); 第 (2) 步 需 0(logn) 时 间 和 O(nm) 处 理 器 ; 第 (3) 步 需 O(logn) 时 间 和 O(n) 
处 理 器 ， 这 一 步 实际 上 是 计算 前 比 的 部 分 ; 第 (4) 步 需 0(1) 时 间 、0O(n) 处 理 器 。 故 整个 算 
法 需 O{logn) 时 间 ，0O(n) 处 理 句 ， 


12.2.2 ”性 路 图 和 性 路 二 分 图 的 基本 概念 


Lev 等 人 基于 SIMD-EREW PRAM 建议 了 二 分 图 边 着 色 的 并 行 算法 ， 他 们 把 冒 
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换 网 络 (Permutation Network) 中 的 选 路 问题 归 约 为 图 论 上 的 图 和 二 分 图 的 边 着 色 问 题 . 
下 面 我 们 将 介绍 他 们 的 算法 . 

—^ n MÉTA d-EiBl(n-vertex d-way Graph) 是 由 顶点 集 {1 2,000 XX £2, d PRI 
枝 集 (Branch Set) 组 成 ， 其 中 每 个 分 枝 是 不 同 顶 点 的 一 个 无 序 对 ， 每 个 顶点 至 多 出 现在 一 


个 分 枝 中 . 
已 知 一 个 乒 路 图 ， 人 们 可 以 获得 一 个 顶点 度数 至 多 为 d 的 图 ， 具体 做 法 是 :将 每 个 
BATRI) 62) = CPER- DIA LEP). @ 7 DIG?) 


和 替换， 这 样 我 们 就 得 到 一 个 一 般 的 无 向 图 ，1 和 PP Pen les J'«d. 

一 个 2m 个 顶点 4- 路 二 分 图 (2m-vertex d-way Bipartite Graph) HAMRI, 2, + 
mx fl, 2, se. @bx 行 ，2} 和 分 枝 集 所 组 成 .每 个 分 枝 是 不 同 顶 点 的 一 个 无 序 对 ， 这 个 无 序 
对 的 一 个 顶点 来 自 集 合 科 ，2，…，m} x{L 2, =n atx {1}， 另 一 顶点 来 自 集 合 f1，2，… 
mxi 2, e dx {2}。 每 个 顶点 至 多 在 一 个 分 枝 中 出 现 ， 注 意 本 节 的 m 不 是 指 图 的 边 
X. 

我 们 使 用 二 路 图 或 4- 路 二 分 图 ， 是 因为 它们 较 对 应 的 图 或 二 分 图 含有 更 多 的 信息 . 显 
而 易 见 ， 一 个 图 或 二 分 图 很 容易 转换 成 对 应 的 二 路 图 或 d 路 二 分 图 .本 节 仅 讨论 和 路 图 或 
4 路 二 分 图 的 边 着 色 . 一 个 4- 路 图 或 二 路 二 分 图 的 着 色 是 一 个 函数 ， 这 个 阔 数 给 它 的 每 个 
顶点 赋 给 一 种 颜色 jefl，2，…，d}. 4- 路 图 或 志 路 二 分 图 的 一 个 项 点 对 应 原来 的 图 或 一 
分 图 的 4 个 顶点， 它们 将 赋 给 不 同 的 颜色 。 对 4- 路 图 或 4 路 二 分 图 的 一 种 着 色 是 边 着 色 ， 
车 每 个 分 枝 的 两 个 端点 都 着 上 相 局 的 额 色 ， 则 这 种 颜色 就 是 对 应 图 的 边 着 色 。 


12.2.3 ”2 一 路 图 的 边 着 色 并 行 算法 


首先 我 们 讨论 一 个 最 简单 的 2- 路 图 的 边 着 色 算法 。 一 个 2- 路 图 是 由 许多 不 同 的 连通 
分 支 组 成 ， 每 个 连通 分 支 或 是 一 条 无 回路 的 路 径 或 是 一 条 回路 。2- 路 图 有 «- 色 的 边 着 色 
当 且 仅 当 它 不 含 奇数 条 边 的 回路 〈 复 称奇 数 边 回路 )， 
1。 算法 的 基本 原理 

本 节 的 算法 或 是 给 2- 路 图 的 边 着 色 或 是 检测 奇数 边 回 路 ,二 个 项 点 的 2- 路 图 将 用 两 
个 二 维 数 组 LIBR. AIGA MEI ME UR IE ")8 PERS RB 
(LI). GJ METERS. AMAG ) 不 在 分 枝 中 出 现 ， 则 置 fi )-0. JG) )-0. BA 
色 将 用 二 维 数组 O FIC, TUNG) ) 的 颜色 为 Q(ij )， ; 

车 2 路 图 存在 一 个 边 着 色 ， 则 着 色 不 唯一 . 这 是 因为 对 任 一 连通 分 支 内 的 颜色 可 
以 进行 对 换 . ACE GUERRA IH APTE DID MEG (Canonical Edge Coloring). 
DAC LJ ) 的 规范 着 色 是 指 : 若 i 是 对 应 图 的 连通 分 支 内 标号 最 小 的 顶点 ， 则 /就 是 2 
路 (4- 路 ) 图 的 顶点 ( L7 ) 的 颜色 ， 

算法 的 基本 策略 是 :对 每 个 连通 分 支 内 的 最 小 标号 顶点 的 规范 着 色 以 指数 的 速率 
迅速 传播 到 整个 连通 分 支 ， 在 一 个 回路 中 ， 这 种 传播 可 以 返回 ; 车 回路 中 含 偶数 条 
边 ， 则 不 会 引起 什么 后 果 ; 若 回路 中 含 奇 数 条 边 ， 则 将 引起 写 冲突 ,这样 就 可 以 检测 
奇数 边 回路 存在 ， 
2， 算 法 的 形式 化 描述 


一 237 一 


算法 12.8 EDGE-COLORING 2-WAY GRAPHS 
WA: 2- 路 图 的 存 贮 结 构 : 二 维 教 组 了 I 
输出 : 顶点 着 色 的 二 维 数组 Q; 车 不 存在 边 着 色 ， 则 检测 出 琳 数 边 加 路。 
procedure Edge. Coloring 2. Way_Graph(l. J, Q); 
begin 
(1) for each i: 1 ix n pardo VALE 初始 化 * / 
for j—1 to 2 do 
IG pyle jx 
Jb Pele jx 
Pj) /*PAEiGDERDESEqUSERAY:/ 
glij i 
endfor 
endfor; 
(2) for sel to flogs! do 
for cach i: 1& i n pardo 
for j«-1 to 2 do / * SER RG) ER ZAMAT)” 7 
Peri PGs): 
ifi 20  /* 表 示 此 项 点 在 一 分 枝 中 * / 
then if P(Lj)» PGS) / * 人 PP) 的 当前 连通 分 支 标识 较 小 * / 
then P( i,j )- PG"); 
if s=1 
then Q( ij yO) / «e * / 
ebe QU i,j )-3-QG" 六) 
/*(h DAC, FERAM KG DESC, /HRAME® / 
endif 
endif 
endif; 
RRK LI EB 2T 的 顶点 ， 若 存在 的 话 *+ / 
DG Aw. HP) 
Dt. HF). 
endfor; 
forj--1 to 2 do 
/ * 对 每 个 分 枝 的 顶点 赋予 当前 连通 分 支 的 最 小 标号 * / 
if PC Lj) PC 633-7) 
then PCI, APC 3-jy 
Qi f)<3-O( i 3-7j) 
endif; 
/ * 检测 奇数 边 回路 * / 
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if P(i, 1)- P(, 2) and QU, 1)-QG. 2) 
/ RB SUL EU ARS OS 7 
then return( ‘There exists odd cycle") 
endif 
endfor 
endfor 
endfor 


end. 


算法 12.8 在 执行 s 次 循环 后 (ts s< logi), (D 若 存 在 一 个 顶点 (i" ,i ")， 它 与 
(ij) 之 间距 离 是 2， 则 CHT Og)": 若 没 有 这 样 的 顶点 ， 则 
l(ijj&0HJ(CL)-0. Q) P( ij ) 是 与 i 距离 至 多 为 2"! 的 所 有 顶点 的 最 小 标 导 。 
(3) 35 i 是 到 它 至 多 为 2”! 的 所 有 顶点 的 最 小 标号 ， 则 QC LJ ) 是 顶点 ( L/ ) 的 规范 着 色 。 
定理 12.13 在 SIMD-EREW PRAM 上 ， 对 一 个 n 个 顶点 的 2- 路 图 进行 边 着 色 ， 算 法 
12.8 需 0(ogn) 时 间 、0O(n) 处 理 器 、 

证 明 由 算法 12.8 可 知 ， 第 (1) 步 需 OCDE. OGLE: 第 (2) 步 需 O(logn) 时 间 、 
O(nm) 处 理 器 ， 故 整个 算法 需 O(logn) 时 间 和 O(n) 处 理 器 。 


12.2.4 OKR 性 路 二 分 图 边 着 色 的 并 行 算 法 


本 节 我 们 介绍 性 路 二 分 图 边 着 色 算 法 ， 应 当 指出 ， 这 里 仅 考 虑 4 是 2 的 等 的 情形 . 
一 个 2m 个 顶点 CHOP AHAB — HECHL 了 和 JER. M =r, 
AMI KEJ Qk KEJ D= EXER PEA ,2))。 若 顶点 (Gi,jk) 不 在 
任何 一 条 分 枝 中 出 现 ， 则 置 IG ky 0. Ji jki. 这 样 一 个 二 分 图 的 着 色 将 存放 在 三 维 
数组 @ 中 ， 顶 点 {ij ORREK QUI K), 1« LZ «m 1«j, j'«d 1«k«2. 
1， 算 法 的 基本 原理 
算法 的 基本 策略 是 : 递归 地 将 x 个 顶点 dt~ 路 二 分 图 分 裂 成 两 个 于 个 顶点 4 17 2- 路 
二 分 图 ， 直 到 4 '/ 2= 2 时 为 止 ， 其 中 a "是 2036. 然后 利用 2- 路 图 边 着 色 算法 对 2m 
个 顶点 d-- 路 二 分 图 的 边 进行 着 色 ， 这 里 的 初 值 为 2m，d ALD d. 
设 n=md， 定 义 函 数 ys {12m x (12,717 (1,2, dT: 
yw j)-di-yj, 1«i«m,l«j«d 
同时 令 函 数 x: (L2, 27m GR BEL non £12, d MGE CAE RIED: 
mÁk)mi(k-1)/d| +1, l&k«n 
BÁK) = ((k-1) mod 2-1, 1« «n 


2. 算法 的 形式 化 描述 
下 面 的 算法 使 用 了 IF CEMA. ROT, pr, JEE lH, OE 
2- 路 图 的 边 着 色 ， 


算法 129 EDGE COLORING 2-WAY BIPARTITE GRAPHS 
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输入 : 2m 个 顶点 d-(d= 2)— 2-6 HUE AE II I J 
输出 : DASE ZB OQ, 
procedure Edge Coloring d. Way. Bipartite Graphs N(,J,Q); 
begin 
(G) for each i, j: (I& ic m) &(1« j«d) pardo /+ 初始 化 */ 
for k~i to 2 do 
Qi ki; 
endfor 
endfor; 
(2) fors<-1to llogd! do 
(2.1) for each i, /: (1< i m) & (1< j< d) pardo 
(2.1.1) for kl to 2 do 
gli, à ki 
i ya Ba, ADN; f 782,0); 
TG Y; GPO; 
PWG] Rf dk 
ifí»0 then q'—Q(i', j '3—k); ` 
TG* Yuki asa, a), 37k); 
TE f Y, 4) 


endif 
endfor 
endfor; 
(2.2) call Edge. Colring_ 2_ Wag_Graph (F, 7, Q^); 
(2.3) for cach i, j:1«& i« m and 1< j& d pardo 
for kei to 2 do 
4—Q(5 À kj 
PM ABar AI) E) Pata; la); 
QU. b R448 a 49. O° GP» 
endfor 
endfor 
endfor 
end. 


算法 12.9 在 执行 = 次 循环 后 ，(D DURQLA), =, (LA ROBIE QULA, 1, Qd KS 


不 相同 ; (2) EPAD, (7 .27 来 讲 ，C( D QG 29 2' 同 余 ; (3) d- 路 


图 


已 分 解 成 (4/ 29- 路 子 图 在 同一 子 图 中 的 所 有 顶点 (tj 有 都 有 相同 的 5，(2G 大 ) 值 ， 全 
路 图 的 顶点 ( 试 ) 可 被 看 作 (47 2 -路 子 图 的 顶点 (L(y (QUIE). PL ie <m, 1 


€Ài/sd.ixkx2. 


定理 12.12. 在 SIMD~EREW PRAM 上 ， 对 一 个 顶点 最 大 度数 为 4 (4 是 2 FE) Mn 


个 项 点 的 二 分 图 进行 边 着 色 ， 算 法 12.9 需 O(logdlogm) 时 间 、OUzd 处 理 器 . 


证 明 根据 算法 12.9， 第 (1) 步 需 O(md)- O(nqd 处 理 器 及 OHM, 第 (2) 步 执行 了 
OUdogd) 次 ， 每 次 调用 算法 12.8， 需 O(logn) 时 间 ， 故 整个 第 (2) 步 需 O(logdlogn) 时 间 和 
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Otrq) 处 理 器 ， 所 以 整个 算法 需 OGogdlognyt TA], O(a) Abia. 


12.2.5 正 整 数 d- 路 二 分 图 边 着 色 的 并 行 算 法 


上 一 小 节 介绍 了 d 是 2 的 赛 次 方 的 4- 路 二 分 图 的 边 着 色 算法 ， 这 里 我 们 故 宽 这 个 限 
制 ， 设 4 为 任意 正 整数 ， 我 们 来 讨论 二 路 二 分 图 边 着 色 并 行 算法 ， 在 SIMDCEREW 
PRAM 上 ， 算 法 需 O(logdlog2m) 时 间 、O(nd) 处 理 器 . 下 而 就 介绍 这 种 并 行 和 法 ， 
Lo 算法 的 基本 原理 

本 节 介绍 的 算法 和 前 面 的 算法 不 同 ， 这 里 采用 了 迭代 改进 策略 ， 每 次 挝 代 使 不 一 致 的 
着 色 边 数目 减少 一 个 常数 倍 ; .最终 达 到 对 所 有 边 进行 d- 着 色 的 目的 。 算 法 的 关键 是 : ,每 
次 选取 颜色 为 尽 可 能 大 的 2 KE (但 不 超过 加 的 子 图 而 且 用 算法 12.8 进行 着 色 。 只 要 选 
择 恰当 ， 每 次 迭代 时 两 端点 着 色 不 一 致 的 边 都 减少 了 一 个 常数 信 . 

这 种 将 任意 的 d AH d 是 2 的 冠 次 方 情形 ， 最 阜 是 由 Gabow SAR, 算 
法 的 一 个 重要 子 过 程 是 : 每 次 和 迭代 至 少 选 择 了 不 一 致 边 总 数 的 1 / 6 条 边 进行 合法 着 色 。 

因为 每 次 循环 选 代 时 使 得 至 少 有 1 7 6 的 不 一 致 着 色 边 进行 合法 着 色 ， 所 以 需 经 
过 floggm1 次 选 代 才 能 使 得 整个 图 的 边 着 色 . 算法 分 为 两 个 阶段 ， 第 一 阶段 是 选择 枚 举 


法 ， 在 不 改变 合法 着 色 边 颜色 的 条 件 下 ， 对 d- 路 图 的 顶点 集 和 ,1k), 02,8), *- (d, HE 
举 选 择 {1,2,…,d} 中 的 值 ， 使 得 至 少 有 1/ 6 不一致 的 着 色 分 校 (i,j ,D, (FF "2 RARE 
色 QUID, OU. .2) 都 在 集合 f1,2.…,d"*} 中 ， 其 中 4" =2" 34 n* 一 md* .第 二 阶 
段 的 工作 是 : DUAE LE) s (i,d,k)} 的 着 色 是 枚 举 选 择 {1,2,…,d"* } 的 值 ， 使 得 端点 总 色 
属于 f1,2,…,d* ;的 分 枝 都 得 到 的 合法 边 着 色 ， 但 不 改变 端点 颜色 在 由 :2,….4” } 的 分 梳 都 得 
到 的 合法 边 着 色 。 这 样 ， 原 来 不 一 致 的 着 色 边 经 过 一 次 循环 选 代 后 ， 至 多 还 有 5/6 的 分 
枝 仍 为 不 一 致 着 色 边 。 

设 集合 和 2 成 划 分 为 四 个 子 区 间 Dy = fatah} De fasts arth}, D= ael 
ath}, Dalat ag, JB: wa=0 L-1(48)/4) . apap, b-l(dH2/40 ， 
O=aztly =U) /4) . aM as 和 4=LL4 . 

^  C;-DuD, C,-D,UD, C=DivDy, Cy= DVDs, Cs=DyD, 和 
Ce= Dy Dy, 对 ref1,2,…,6}， 令 x 是 C, 的 特征 函数 ， 定 义 如 下 : 

: 1, jeC, 
xo. jec, 

对 任何 属于 行 ,2,…,a} 的 一 对 颜色 q Reg’, FERRET re {127-6} Ag 及 9 
都 属于 C,， 这样， 至 少 有 1/6 的 不 一 致 着 公 近 ， 它 的 端点 颜色 都 属于 C,. 

35 dx c Leet EI y tly e HE 122d} 的 两 个 不 相交 的 子 区 间 . 令 
是 交换 这 两 个 区 间 集 合 人 ,2,…,d} 的 一 个 枚 举 。 
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2 算法 的 形式 化 拱 述 


莫 法 12.10 EDGE-COLORING OF BIPARTITE GRAPHS WITH DEGREE d 
输入 : 2m 个 顶点 2738 — 4 EL 89 5 MES AREE I, J; 
输出 : WAP EMSAM O. 
procedure Edge Coloring | Bipartite__Graphs(G); 


begin 

(I) for each i, :(1& i m) and(1& j <d) prado 7 + 初始 化 * / 
fork--l1 to 2 do 

Qu ig-j 
endfor 
endfor; 
(2) fors<1to [logs snl do /* 第 一 阶段 */ 
(1) a~; 


(Q2) for r'—1 to 6 do 
Q.2.1) for each ij:(1« (€ m) and (1« j <d) pardo 
Alij y0; / + 作为 工作 数组 * / 
PeÉLj Ay LJ.) 
i20 then if Q(Lj,)-Q('2). / * 此 分 枝 合法 着 色 * / 
then 4(, y x/(QGID)* x (QU 2) 
/ * 计算 此 分 枝 端 点 是 否 属于 集合 Cox / 
endif 
endif 
endfor; 
(2.2.2) for each ijj: (1 & i & m) and (1x j« d) pardo 
a Y AGD 
endfor; 
(423) if a<a’ then a--a; rr endif 
/ * 分 枝 端点 的 颜色 在 集合 C, 中 且 含 分 枝 数 目 最 多 的 是 C,* / 
endfor; 
/ * 应 用 mr 对 着 Cr 内 颜色 的 分 技 着 色 * / 
(2.3) for each ij:(1& i & m) and (1x j <d} pardo 
for k--1 to 2 do 
Q(, à kyr Qlik) 
endfor 
endfor; 
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(24) for cach ij:(l« i m) and (1x j& d) pardo / * 第 二 阶段 * / 
for k<-1 to 2 do 
qa Oi); 
if gad / *HARBRT 2d 7 
then L(,gk)--0; Jilig ky-0; / * 工作 数 组 * / 
TY 了 
0 /* 车 为 真 ， 表示 存在 一 条 分 枝 * / 
then ¢'+-O(i',j ',3-k); / * 此 分 枝 另 一 端点 颜色 ， / 
if g/«d' then I(igk)~i; Jig, k)--q' endif 
endif 
endif 
endfor 
endfor; 
(2.5) call Edge__Coloring__d__way__Bipartite_Graphs NU FQ"); 
/ 对 一 些 分 靶 重 新 着 色 ， 使 其 成 为 合法 着 色 边 * / 
{2.6) for eachij: (1<i<m) and(1« j& d) pardo 
for k<-1 to 2 do 
q7-Q(. ik) 
if qxd" then Q(iE)--Q'(Lik) endif 
endfor 
endfor 
endfor 
end, 


算法 12.10 在 执行 了 KERE, (D) BURG) dB QC, LE) Q4) 
都 不 相同 ; (2) 至 多 有 (576j RARE D CNA Be QUID 
QU 2) 不 一 致 ， 其 中 1 <&i «m, 1<} j'«d, 1«k«2. 
定理 12.13 在 SIMD-EREW PRAM 上 ， 对 顶点 最 大 度数 为 4 (4 为 任意 正 整 数 ) Hn 
个 顶点 的 二 分 图 进行 边 着 色 ， 算 法 12.10 需 O(logdlogn) 时 间 、O{nd) 姓 理 髓 ， 
证 明 根据 算法 12.10 可 知 ， 第 (1 步 需 O0D 时 间 和 Old 处 理 器 ; 第 (2) 步 需 执行 Olon. R 
IEA 00) 时 间 及 处 理 器 ; 第 (22) 步 需 O(logn) 时 间 ( 求 和 ) 及 On MOIE O(1) 
时 间 及 Old 处 理 器 ; 第 2.4) 步 需 00) 时 间 及 Otng) 处 理 器 ; 第 (2.5) 步 由 定理 1212 可 知 ， 需 
OQogd" loge" ERBE Of" d' 处 理 器 ; 第 (2.6 步 需 ODT i. O(ndhb J. 
此 ， 第 (2) 步 共 需 O(logdlog'n) 时 间 (d° =2™™" <d, n' -md' «nd) AM O(1) AHE 
38. MENAIRE O(logdlog*n) 时 间 和 O(n) 处 理 器 . 若 4= O(n), MARR O(log’ n) 
时 间 , 


122.6 多重 图 边 着 色 的 并 行 算 法 


对 二 分 多 重 图 来 讲 ， 我 们 从 上 节 可 知 ， 其 边 着 色 算法 的 基本 思想 : 首先 找 出 图 的 欧 拉 划 
分 ， 然 后 再 对 边 进行 卷 色 。 假设 是 一 个 要 着 色 的 图 ， 且 它 的 最 大 小 数 为 偶数 ， 增 加 一 个 
新 顶点 且 把 这 个 新 顶点 与 G 的 奇数 度 顶点 相连 ， 增 值 G 成 为 一 个 欧 拉 图 G*. RBG” Md 
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回路 ， 任 选 一 个 顶点 v. 令 eu FA v» HUSA LA, IRA G 的 边 被 划分 为 两 个 集合 ， 
FT RRA ORT eL IVT AR ;是 奇数 还 是 偶数 。 这 样 每 个 集合 导出 的 子 图 最 大 度数 
为 A/ 2， 如 此 递归 地 分 玖 ， 直 至 导出 简单 回路 或 路 径 时 为 止 ， 这 时 就 是 2- 路 图 ， 利 用 上 节 
介绍 的 技术 ， 由 定理 12.13， 我 们 可 以 在 OQogAm) 时 间 内 利用 OA 站 处 理 器 给 一 个 二 分 多 
重 图 的 边 进行 并 行 着 色 ， 其 中 = 是 G 的 顶点 数目 ，A 是 图 G 的 顶点 最 大 度数 。 
1. 算法 的 基本 原理 

我 们 假定 图 G(Y, 轧 是 一 个 连通 的 多 重 图 ， 不 然 的 话 ， 利 用 第 四 章 的 顶点 倒塌 法 可 以 
求 出 每 个 连 遂 分 支 ， 然 后 同时 对 每 个 连通 分 支 进行 边 着 色 ， 对 一 般 多 重 图 ， 构 造 一 个 有 效 
的 并 行 算法 仍 要 利用 欧 拉 遍 历 技术 .了 arloff 等 人 中 基于 SIMD-CRCW PRAM， 介 绍 了 
多 重 图 G (VE) 着 3 TA721 种 颜色 的 并 行 算法 . 算法 工作 过 程 是 : 首先 将 G 转换 成 一 
个 辅 图 GS, Gy 是 一 个 二 分 多 重 图 ， 对 Gs 边 并 行 着 色 ; 然后 令 M 表示 GC, 中 着 颜色 ci 的 
边 的 集合 ， 显 然 M 是 Ge 的 一 个 匹配 ， 位 于 Mi; 这 些 边 对 应 多 重 图 G 的 边 导出 一 个 子 图 
Go GC, 的 最 大 虚数 小 于 等 于 2， 期 G, 是 路 径 或 简单 回路 的 集合 ; 最 后 ， 对 每 个 G 用 3 种 
颜色 进行 着 色 。 因 为 G 至 多 分 解 成 A / 2) 个 子 图 ， 故 共 需 3 TA/21 ABN G 的 边 
进行 着 色 ，1<is<s TA/21. 
2 算法 的 非 形式 化 描述 


算法 12.11 EDGE-COLORING OF MULTIGRAPHS; 
RA: SER GE B EO: 
输出 : 每 条 边 e 着 色 cle), eE. 
procedure Edge. Coloring .of. Mulügraph(V,E; / * G(V,) 是 一 个 多 重 图 * / 
begin 
(0) 构造 一 个 二 分 多 重 图 GX, Y, Ej)T: 
(1.1) 车 G 不 是 一 个 欧 粒 图， 增加 一 个 顶点 v 到 G 中 ， 且 增加 z 与 所 有 坷 数 度 顶 
点 关联 的 边 ， 形 成 欧 拉 图 G'; 
(1.2) 应 用 第 九 章 算 法 9.1 找 出 G' 的 有 向 欧 拉 回路 ; 
(L3) 对 veV, $ veX,veY; Ero; 
(4) 从 有 向 欧 拉 回路 某 一 顶点 出 发 遍历 网 拉 回 路 ， 若 遍历 次 序 是 从 ?到 u R 
| 一 条 无 向 边 (到 到 Es 中; 
/ * 构造 出 的 Ga 的 最 大 度数 至 多 为 CASI 7 
(2) call Edge. Coloring Bipartite_“Graphs(Ga); VER VUES 12.10% / 
(3) MÈG PARE ci 的 边 集合 ， 对 每 个 cn， 构造 一 个 多 重 图 Gi 如下: 
HREM ,De M,， 将 边 (uV) 加 入 EE 中 ， 因 Mj 是 Gg 的 一 个 匹配 ， 对 应 多 
重 图 G8 dC, Tp Gi 是 路 径 和 简单 回路 的 集合 ， 
(4) 每 个 Gi 同时 用 三 种 颜色 着 色 ， 即 调用 算法 12.8， 若 检测 到 奇数 回路 ， 则 将 一 条 
边 着 第 三 种 有 矣 色 ， 其 余 边 用 另 两 种 颜色 着 色 


end. 


定理 12.14 f£ SIMD-CRCW PRAM 上 ， 对 一 个 多 重 图 GVA), IVi-n 的 边 用 3 
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TA7/21 种 颜色 并 行 地 着 色 ， 算 法 12.11 需 O(log’(An)) HT A O(Am 处 理 器 ， 这 里 A 
是 6 的 顶点 最 大 度数 . 
WEBB 根据 算法 12.11， 第 (1.0 步 需 O(logm) 时 间 、O(nA) 处 理 器 ; 第 (1.2) 步 由 定理 9.1 可 
知 ， 需 O(log(nA)) 时 间 和 OVALE: 第 (1.3) 步 需 O(1) 时 间 和 O(n) 处 理 器 ;第 (1.4) 步 需 
O(log(nA)) 时 间 和 O(zA) 处 理 器 。 故 第 (D 步 需 O(logtnA)) 时 间 和 O(nA) 处 理 器 。 第 (2) 步 由 
定理 12.13， 需 O(log HAHA Al O(nA) 处 理 器 ， 第 (3) 步 需 O(1) 时 间 、O(nA) 处 理 器 。 第 
(4) 步 由 定理 12.11 知 ， 需 O(logn) 时 间 和 O(nA) 处 理 器 ， 因 此 ， 整 个 算法 需 OQ og (nA) t 
间 、OnA) 处 理 器 。 . . 

Karloff 等 人 基于 同一 计算 模型 ， 还 考虑 A - 3 这 一 特殊 情况 下 多 重 图 边 着 色 的 并 行 

算法 ， 他 们 给 出 了 一 个 O(logn) 时 间 和 O(n my Khe PE, 
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对 图 论 上 一 个 比较 复杂 而 又 具有 广泛 应 用 背景 的 着 色 问 题 ， 本 章 重点 岳 述 了 这 一 问题 的 
并 行 算法 .主要 内 雁 包括 : 顶点 度数 为 常量 的 图 的 顶点 着 色 算 法 及 其 在 计算 图 的 极 大 独立 集 
中 的 应 用 ; 平面 图 顶点 的 ECH 9 着色 并 行 算法 以 及 最 优 的 5- 着 色 并 行 算法 ; 树 的 边 着 
色 快 速 并 行 算法 ; 二 分 图 的 边 着 色 并 行 算法 以 及 多 重 图 边 着 色 的 有 效 并 行 算法 等 。 


八 十 年 代 来 期 ， 国 际 上 对 图 的 着 色 问题 的 并 行 化 进行 了 较 深 入 的 研究 ， 取 得 了 丰硕 的 成 
R, 除了 我 们 介绍 的 一 些 典型 算法 外 ， 还 有 许多 重要 文献 成 果 尚 待 引 人 . Karchmer 等 人 上 
基于 SIMD-CRCW PRAM， 对 不 含 奇数 边 回路 的 图 用 A 种 颜色 对 图 顶点 进行 着 色 ， 给 出 
了 一 个 O00oBm) 时 间 、OGrtm) 处 理 器 的 并 行 算法 ; 而 Boyar 等 人 04 基 于 SIMD-CRCW 
PRAM， 对 平面 图 顶点 问题 ， 建 议 了 一 个 5- 着 色 随 机 并 行 算法 ， 他 们 算法 期 望 的 时 间 复 杂 
性 为 Ollog:m)， 使 用 了 OCP NAR; 有 关 图 的 边 着 色 的 并 行 算法 ，Karloff 等 人 [9 此 于 
SIMD-CRCW PRAM， 对 著名 的 Vizing 定理 进行 并 行 化 ， 给 出 了 一 般 简 单 图 用 (A+1) 边 着 
STIRS, ATMS OAM log? yt lA Ofz2o) 处 理 器 ; 显然 仅 当 A= O(log n) 
时 此 算法 方 为 有 效 ， 随 后 基于 同一 计算 模型 ， 他 们 又 建议 了 此 问题 的 一 个 并 行 随机 算法 ， 算 
HAWEA O(log? nA O(n? 中 处理 器 ， 后来， 又 有 人 对 平面 图 边 着 色 问 题 进行 了 研 
究 ， 提 出 了 平面 图 的 边 着 色 并 行 算法 ， 如 Chrobak 等 人 0 基于 SIMD-EREW PRAM， 给 
出 了 一 个 O(logzn) 时 间 ， 使 用 O(n) 钼 理 器 的 算法 ， 其 中 着 色 数 为 maxfA,19}， 随 后 Chrobak 
等 人 9 又 改进 了 他 们 的 算法 ， 基 于 SIMD-EREW PRAM， 所 出 了 一 个 O(log 六 ) 时 间 和 Of) 
处 理 器 的 并 行 算法 ， 其 中 着 色 数 为 max{A,8}; Boyar AEF SIMD-CRCW PRAM, 
给 出 了 一 个 Olomi. ODARA, EARE A> 23。Gibbons APE 
于 SIMD-CREW PRAM 还 给 出 了 一 种 特殊 的 图 (Halin 图 ) 的 边 着 色 并 行 算法 ， 他 们 的 算法 
Ti Ologn) 时 间 及 OQ) bh. 
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第 十 三 章 组 合 BR 


在 这 一 章 ， 我 们 讨论 用 状态 空间 图 表示 的 组 合 搜索 问题 。 所 谓 组 合 搜索 (Combinatorial 
Search)， 就 是 找 “ 定 义 问 题 空 间 中 的 一 个 或 多 个 最 优 解 或 次 优 解 " 的 过 程 个 ， 在 离散 的 、 有 限 
的 数学 结构 土 执行 计算 ， 就 是 组 合算 法 (Combinatorial Algorithm)”, BARRERA 
工 管 能 、 运 筹 学 等 应 用 领域 中 经 常 出 现 ， 例 如 定理 证 明 、 博 奕 比赛 、 找 图 的 最 短路 径 、 求 
旅行 商 的 周游 路 线 等 。 为 了 简化 ， 这 里 只 讨论 树 表示 的 搜索 . 


组 合 搜索 问题 可 以 分 为 组 合 判定 癌 题 和 组 
合 优 化 问题 . 前 者 是 找 满足 给 定 约束 条 件 的 
解 ， 后 者 是 求 最 优 解 ， 即 寻找 一 个 满足 给 定 的 
约束 条 件 并 使 其 目标 函数 值 达 到 最 大 或 最 小 的 
解 ， 在 人 工 智能 中 的 应 用 问题 ， 有 些 属 于 组 合 
优化 问题 ， 如 图 象 识别 与 声音 识别 中 的 最 佳 匹 
配 ， 有 些 高 予 组 合 判定 问题 ， 例 如 定理 证 明和 
其 些 诊断 、 决 策 型 专家 系统 。 

一 个 搜索 问题 可 以 表示 为 一 棵 树 ， 称 作 状 
mss (6) BH (State Space Tree)， 树 的 根 结 点 代表 
要 被 求解 的 原始 问题 ， 非 叶 结 点 (内 部 结 点 ) 
代表 子 问题 。 除 呈 结 点 外 ， 所 有 结 点 可 以 区 分 
为 “与 结 点 "和 “或 结 点 "两 类 ， 与 结 点 代表 的 子 
问题 ， 只 有 当 它 的 全 部 孩子 结 点 都 得 到 解答 时 
它 才 能 和 解决。 相反， 对 于 一 个 或 结 点 ， 只 要 它 
的 一 个 孩子 结 点 已 经 有 了 解答 ， 这 个 或 结 点 代 
表 的 子 问题 就 可 以 解决 。 如 果 一 标 状 态 树 仅仅 
包含 与 结 点 ， 则 称 之 为 “与 树 "， 如 图 13.a) 
所 示 。 实 现 与 树 搜索 的 方法 是 分 治 算法 ， 因 为 
问题 的 解 是 由 它 的 全 部 子 问 题 的 解 组 合 而 成 
的 。 如 果 一 株 状 态 空间 树 只 包含 或 结 点 ， 由 称 
它 为 "或 树 "， 如 图 13.1(b) 所 示 。 实 现 或 树 搜 
索 的 常用 方法 是 分 枝 限 界 算法 ， 因 为 问题 的 解 
可 由 它 的 任何 一 个 子 问题 的 解 而 得 到 ， 如 果 一 
裸 树 既 包 含 与 结 点 又 包含 或 结 点 ， 则 称 其 为 
“与 或 树 ”"， 如 图 13.1(c) 所 示 ， 博 奕 树 (Gamc 
Trees) 是 与 或 树 的 一 个 例子 ， 它 的 搜索 是 运用 
SH (Pruning EAR Kw, AS fii 
a 了 搜索 算法 ， 


图 13.1 用 树 表示 搜索 问题 
(a) SH (b) RA (c) y 
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在 13.1 节 ， 我 们 将 讨论 与 树 的 并 行 搜索 ， 它 是 分 治 方法 的 典型 应 用 。13.2 节 比 较 详 
细 地 介绍 并 行 分 校 限界 算法 ， 并 且 证 明 并 行 分 校 限界 算法 存在 着 异常 现象 ， 有 的 情形 是 增 
加 处 理 器 数目 可 能 增加 搜索 的 执行 时 间 ， 有 的 场合 是 增加 处 理 器 的 数目 则 可 能 导致 执行 时 
间 不 成 比例 的 减少 .wx-8 搜索 算法 将 在 13.3 节 出 现 ， 若 干 并 行 化 的 -8 搜索 方法 将 要 进 
行 讨论 ， 


13.1 436% (Divide and Conquer) 


分 治 方法 是 一 种 问题 求解 的 方法 学 ， 求 解 的 思想 就 是 将 整个 问题 分 成 车 于 个 特性 相同 
的 小 问题 后 分 而 治之 。 通常， 由 分 治 方法 所 得 到 的 子 问题 与 源 问 题 具 有 相同 的 类 型 ， 若 得 
到 的 子 问题 相对 来 说 还 是 太 大 ， 则 可 反复 使 用 分 治 策略 将 这 些 子 问题 分 成 更 小 的 子 问题 ， 
直至 产生 不 用 进一步 细 分 就 能 求解 的 子 问题 为 止 。 也 就 是 说 ， 分 治 方法 是 递归 的 ， 可 以 用 
递归 过 程 来 表示 、 


13.1.1 SIMD 模型 的 分 治 算法 
在 SIMD 模型 上 ， 使 用 分 治 策略 设计 的 并 行 算法 描述 如 下 中 : 


算法 13.1 PARALLEL DIVIDE-AND-CONQUER ALGORITHM 
procedure D&C (I: structure; O: structure); 
/ * 过程 D&C 的 输入 和 输出 分 别 在 结构 I 和 口中 * / 
Local SS2 96 structure; Local T,7;,--,7,: structure; 
begin 
if SMALL(L O) 
then return (ANSWER(I;O)); 
else / * 将 问题 分 成 天 个 类 型 相同 的 子 问题 ， 由 输入 站 构 工 形成 大 个 子 
结构 8,8, ,Sr 对 于 天 次 递归 调用 的 输出 ， 指 定 天 个 临时 
结构 TSTTS/ 
SPLITINPUT(L:S),S»,***,5)); 
/ * HATHRAS k KERHA D&C / 
cobegin i 
call D&C(S;7T)); call D&C(S,;7,); = ;eal D&C(S! Ty); 
coend; 
COMBINE(T, 1, ,T,, LO) 
endif 
end, 


其 中 : cobegin—coend 表示 同时 执行 大 次 递归 调用 D&C, SMALL 是 一 个 布尔 函 
数 ， 当 问题 的 规模 足够 小 、 能 够 直接 计算 解答 时 ，SMAILL(LO) 的 值 为 " 真 "， 则 返回 由 
ANSWER 直接 计算 出 来 的 结果 ; 否则 ，SMALL(I,O) 的 值 为 “ 假 "，SPLITINPUT 从 
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原来 的 输入 结构 工 提供 大 个 输 和 结构， 并行 执行 大 个 递归 调用 D&C 的 每 一 个 调用 ， 接 
收 这 些 输 和 结构 中 的 一 个 ， 并 且 对 它 的 输出 指定 一 个 存 贮 区 . 大 个 递归 调用 D&C 并 行 
地 执行 完成 后 ，COMBINE HFEA Tp To =, Ty 及 原来 输入 结构 T Rn 
能 的 值 ， 产 生 原 来 问题 的 解答 。 在 这 里 ，stracture 表示 一 个 或 多 个 更 一 般 的 数据 类 型 。 

在 本 章 的 开始 我 们 曾 提 到 ， 一 个 问题 的 分 治 解 法 ， 可 以 用 一 棵 与 树 来 表示 ， 这 是 因为 
用 内 部 结 点 表示 的 任何 问题 ， 它 的 解 需要 全 部 子 问题 的 解 ， 而 这 些 子 问题 是 由 该 结 点 的 孩 
子 缚 点 表示 的 。 因此 ， 分 治 算法 亦 可 视 作 自 底 向 上 搜索 “与 树 " 的 过 程 ， 而 且 整 棵 树 中 的 每 
一 个 结 点 都 必须 被 计算 . 由 于 递归 调用 D&C 产生 的 个 子 问题 可 以 同时 求解 ， 所 以 分 治 
算法 自然 地 体现 了 并 行 执行 的 概念 ， 可 以 并 行 地 自 底 向 上 搜索 一 棵 与 树 . 


13.1.2 分 治 法 在 MIMD 模型 上 的 实现 途径 


在 MIMD 计算 机 上 实现 分 治 算法 ， 已 经 提出 三 种 途径 ， 第 一 种 方法 是 多 处 理 器 按 树 形 
连接 ， 即 建造 一 柠 和 搜索 树 相对 应 的 处 理 器 择 ， 峡 
132 给 出 一 棵 满 的 三 元 处 理 器 树 ， 它 是 一 元 处 理 
器 树 的 一 个 例子 。 其 中 : P ERAEN, M, 表示 
局 部 存储 器 ， 树 边 表示 处 理 器 之 间 的 连接 线路 ， 这 
种 简单 连接 的 树 机 器 适合 于 VLSI 实现. 然而， 这 
种 方法 有 两 点 不 足 ， 其 一 是 根 处 理 器 将 成 为 系统 的 
瓶颈 口 ， 因 为 它 是 所 有 输入 和 给 出 的 通道 ; 其 一 是 

132 三 元 多 处 更 名 具有 固定 连接 结构 的 处 理 器 树 ， 没 有 足够 的 灵活 
性 ， 但 它 只 对 某 些 分 治 算法 是 合适 的 

第 二 种 方法 是 使 用 虚拟 的 机 器 四， 它 由 若 
干 个 处 理 器 组 成 ， 每 个 处 理 器 带 有 自己 私有 的 
存储 器 ， 处 理 器 采用 健全 的 互连网 络 相连 ， 例 
如 二 进 制 的 超 立方 连接 。 它 具有 相 适 应 的 算法 
决定 子 问题 应 在 何 时 何 处 求解 。 因 为 分 治 算法 
进程 通讯 的 层次 性 ， 使 得 子 问题 可 以 有 效 地 映 
射 到 这 种 体系 结构 上 .图 13.3 所 示 的 体系 结 
构 是 n=3 的 立方 连接 . 

R= HOE eS ARER: 
分 治 算法 ， 可 看 作 是 上 述 两 种 方法 的 变种 。 它 
是 基于 共享 存 贮 的 总 线 结构 ， 即 所 有 的 处 理 器 通过 公共 总 线 连 接 到 共享 存 贮 器 .由 于 数据 
在 执行 过 程 中 必须 共享 。 存 贮 器 或 总 线 可 能 变 成 一 个 瓶颈 口 。 为 了 达到 足够 高 的 共享 存 贮 
和 总 线 带 宽 ， 存 贮 器 可 以 划分 成 独立 的 模块 ， 总 线 可 以 由 几 条 总 线 组 成 ， 其 中 每 一 条 都 连 
接 到 所 有 的 处 理 器 和 若干 个 存 贮 器 模块 上 ， 如 图 13.4 所 示 . 


13.1.3 分 治 算法 的 复杂 性 站 
由 此 看 来 ， 为 了 计算 一 标 与 桂 ， 其 职能 要 求 是 处 理 器 互 连 的 密集 度 (Conglomerato) 
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图 13.3 3 立方 连接 的 虚拟 树 机 


而 重要 的 是 确定 并 行 化 的 粒度 (Granularity)。 所 谓 并 行 化 的 粒度 ， 指 的 是 一 个 处 理 器 为 了 
达到 最 优 性 能 所 计算 子 问题 的 最 小 规模 。 粒 度 反 映 着 处 理 器 互 连 的 密集 情况 。 若 粒度 大 ， 
则 处 理 器 是 松 焰 合 的 ; 否则 是 紧 耦 合 的 。 用 什么 标准 来 衡量 粒度 的 大 小 呢 ? 通常 使 用 的 标 
准 是 处 理 器 利用 (Processor Utilization， 简 记 作 PU), KT? RAT’. 其 中 : 无 是 处 理 回 的 数 
目 ， 了 他 是 计算 时 间 ， 而 4 是 VLSI 实现 的 而 积 。 


i a 
EG Bao be" 
解 。 在 启动 阶段 ， 癌 题 被 划分 旦 任务 传 


图 13.4 SRR. SRN SAM 播 到 网 络 ， 大 多 数 启动 阶段 ， 任 务 少 但 
处 理 回 多 ， 多 数 处理 器 处 于 空转 ， 直 至 它们 被 给 定 一 个 问题 要 划分 和 传播 为 止 。 在 计算 阶 
段 中 ， 所 有 的 处 理 器 保持 繁忙 状态 ， 直 到 系统 中 的 任务 个 数 小 于 处 理 器 个 数 为 止 。 在 组 合 
求解 阶段 ， 将 子 问题 的 解答 组 合 起 来 产生 原 问题 的 解 。 在 这 个 阶段 。 又 存在 任务 比 处 理 器 
少 的 现象 ， 某 些 处 理 器 忙于 组 合 结果 ， 而 其 它 的 处 理 器 则 是 空转 因此， 并行 搜 索 与 树 的 
处 理 器 利用 PU 依赖 于 消耗 在 计算 阶段 的 时 间 总 数 与 其 它 阶段 的 时 间 总 数 之 比值 若 比 值 
大 ， 则 PU K. 为 了 达到 PU 大 ， 要 求 在 启动 阶段 和 组 合 求解 阶段 的 处 理 器 空转 时 间 少 ， 

对 于 一 棵 # 层 的 二 元 与 树 的 并 行 搜索 ， 其 时 间 复 杂 性 可 以 用 下 列 递 妇 方程 表示 : 

S(n) + 2T(n / 2)+ C(n), n>1 
Te)« (^ f 
(D, 否则 
其 中 : SG) 和 Cin) 是 启动 和 组 合 求解 阶段 的 时 间 复杂 性。 

由 此 可 见 ， 要 得 到 最 优 处 理 器 利用 的 粒度 ， 与 S(m) 和 C(m) 的 复杂 性 有 关 ， 例 如， 在 
求 a 个 数 的 和 或 者 求 它们 的 最 大 值 问题 中 ， 使 用 n/ (logn) 个 处 理 器 ，S(n)+C(n)= 0(1)， 
处 理 器 达到 最 大 的 利用 ， 即 PU 是 最 大 . 在 排序 ”个 数 的 问题 中 ， 使 用 og PALES, 
S(n)+C(n)= O(n), ABA ABABA. 关于 渐 近 的 处 理 回 利用 ， 当 Stn)+C(n)== O(n) 
时 ，n/ logn 是 一 个 门限 值 ， 对 于 kn 的 一 个 函数 ) 个 处 理 器 而 言 ， 处 理 器 利用 PU 具有 下 
Xe Pn 

当 dm 0m, M PU 

n(logn) 


在 SIMD 模型 上 研究 分 治 算法 的 

-一 ”复杂 性 时 ， 我 们 确信 它 满足 最 优 的 PU 
十 条 件 。 一 棵 与 树 的 并 行 搜索 ， 粮 路 地 划 
分 成 三 个 阶段 ; 肩 动 、 计 算 和 组 合 求 


" k 
E] Him oma) 20H. WJ 0<PU<1 


当 im—*_ -oo 时 , 则 PU- 0 
n(logn) 
为 处 理 吕 利用 随 着 处 理 器 数目 的 减少 而 增加 ， 它 不 是 一 个 并 行 处 理 器 效率 的 足够 的 
尺度 。 更 为 合适 的 尺度 是 KT? WERE, RES RAS TEGERE IE IRI. E 
并 行 分 治 算法 中 ， 使 得 了 最 小 的 浙 近 最 优 的 处 理 器 数目 ， 当 Stn)+C(n)= O(D 时 ， 它 是 
Oln/ logm， 模 拟 计 算 的 结果 ， 证 实 了 最 优 的 处 理 回 数目 或 者 精确 地 是 n/ (logn-1)， 或 
者 非常 接近 这 个 值 。 
最 后 还 要 指出 : 最 优 的 粒度 依赖 于 问题 的 复杂 性 、 与 树 的 形状 《与 树 是 否 平衡 )、 以 
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及 沿 着 每 一 条 路 径 上 各 结 点 计算 时 间 的 分 布 四， 


13.2 分 枝 限 界 法 (Branch and Bound) 


求解 组 合 搜索 问题 的 常用 方法 是 分 枝 限界 算法 0]， 它 是 回潮 法 (Backtracking) 的 变 
种 ， 是 一 种 流行 的 算法 设计 技术 ， 分 枝 限界 法 利用 部 分 解 的 最 优 性 信息 ， 避 免考 虑 那些 不 
能 导致 最 优 的 解 ， 从 而 快速 地 求 得 问题 的 解答 。 


13.2.1 8 一 这 问题 一 一 个 例子 


现在 ， 我 们 先 用 一 个 实例 来 介绍 分 枝 限 界 方法 ，Sam Loyd 1878 年 提出 了 15-8] 
题 ， 这 里 考虑 简化 的 8- 谜 问题 ， 如 图 13.5 所 示 。 在 一 个 3x 3 的 棋盘 上 排放 着 编导 为 ! 
至 8 的 8 张 牌 ，8 个 位 置 上 从 好 一 个 位 置 放 一 张 牌 ， 剩 下 一 个 位 置 为 空格 ， 对 于 任意 给 定 


T T 
| 
1 5 2 1 2 | 3 
- IZ, — — o 
4 3 | 4 ! 5 | 6 
9 i 
7 s | 6 7 8 GZ 
(a) PHS: (b) 目标 排列 


图 13.5 8~ 壕 问题 


的 一 种 初始 排列 ， 如 图 13.S(a) 所 示 的 排列 ， 要 求 通过 一 系列 的 合法 的 移动 移 成 图 13.5(b) 
押 示 的 排列 ， 所 谓 合 法 的 移动 就 是 将 邻近 空格 的 上 、 下 、 左 、 右 位 置 中 的 某 一 张 牌 移 到 空 
格 内 ， 对 图 13.5(a) 的 情况 ， 开 始 有 三 种 可 能 的 合法 的 移动 ， 即 将 牌 2、3、6 之 中 的 一 张 
牌 移 到 空格 内 .在 做 了 这 次 移动 之 后 ， 才 可 以 佑 下 一 次 移动 。 每 移动 一 次 ， 产 生 一 种 新 的 
排列 。 每 一 种 排列 称 作 这 个 谜 问题 的 一 个 状态 (Statej。 初 始 排列 和 目标 排列 叫做 初始 状态 
和 目标 状态 《答案 状态 )。 洲 由 初始 状态 到 某 个 状态 存在 一 系列 的 合法 的 移动 ， 则 称 该 状 
态 可 由 初始 状态 到 达 。 一 个 初始 状态 的 状态 空间 (State Space) 由 所 有 可 以 从 初始 状态 到 达 
的 状态 组 成 。 可 以 将 此 状态 空间 构造 成 一 棋 树 ， 叫 做 状态 空间 树 ， 初始 状态 是 这 标 树 的 
根 ， 所 有 可 以 从 初始 状态 到 达 的 状态 是 这 棵 树 中 的 结 点 ， 每 一 条 树 边 表示 一 次 合法 的 移动 
( 即 是 表示 一 次 操作 )。 不 难看 沾 ， 移 动 牌 和 移动 空格 实质 上 是 等 效 的 ， 而 且 在 做 实际 的 移 
动 时 更 加 直观 ， 因 此 我 们 以 后 都 将 从 父 状态 到 子 状态 的 一 次 转换 ， 看 成 是 空格 的 一 次 合法 
的 移动 ， 对 图 13.5(a) 所 示 的 初始 状态 .图 13.6 给 出 了 这 棵 状态 空间 树 的 一 部 分 . 

对 于 任何 一 个 问题 ， 一 号 设想 出 一 种 状态 空间 树 ， 那 么 就 可 以 通过 系统 地 生成 问题 状 
态 ， 接 着 确定 这 些 问题 状态 中 的 哪些 状态 是 解 状态 ， 最 后 确定 哪些 解 状态 是 答案 状态 而 将 
这 问题 解 击 ， 系 统 地 生成 问题 状态 ， 首 先 从 根 结 点 开始 ， 然 后 生成 其 它 的 结 点 ， 如 果 已 生 
成 一 个 结 点 而 它 的 所 有 孩子 结 点 还 没有 全 部 生成 ， 则 这 个 结 点 叫 微 活 结 点 ， 当 前 正在 生成 
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其 孩子 结 点 的 活 结 点 叫做 了 - 结 点 〈 正 在 扩展 的 结 点 ). 不 再 进一步 扩展 或 者 其 孩子 结 点 
已 全 部 生成 的 结 点 就 是 死结 点 《被 抛弃 的 结 点 )， 为 了 生成 其 它 的 结 点 ， 需 要 一 张 活 结 点 
表 来 保存 活 结 点 ， 若 活 结 点 表 采 用 栈 结构 ， 则 是 深度 优先 生成 法 。 若 活 结 点 表 采 用 队列 结 
构 ， 则 是 宽度 优先 生成 法 。 这 两 种 生成 法 都 是 呆板 而 盲目 的 ， 它 们 不 考虑 开始 的 状态 如 
何 ， 总 是 按 千篇一律 的 顺序 生成 (或 搜索 )、 耗 费 许 多 时 间 在 那些 不 能 很 快 找到 答案 结 
点 、 甚 至 找 不 到 答案 结 点 的 子 树 上 搜索 . 


图 13.6 8-- 迹 问题 实例 的 部 分 状态 空间 树 


如 果 对 每 个 活 结 点 定义 一 个 “有 智能 的 "的 优先 级 函数 f+). WE A> KER 
下 一 个 吾 - 结 点 往往 可 以 加 快 到 达 一 个 答案 结 点 的 速度 .8(。 ) 叫 做 结 点 的 代价 函数 ， 定 
义 如 下 : 车 x 是 答案 结 点 ， 则 f(x) 是 由 状态 空间 树 的 根 结 点 到 x 的 代价 ; E x 不 是 答案 
MAP x 不 包含 任何 答案 结 点 ， 则 f(x)= oo, EU 了 (x) 等 于 子 树 x 中 具有 最 小 代价 
的 答案 结 点 的 代价 。 但 要 指出 的 是 ， 要 得 到 代价 函数 S ) 所 用 的 计算 工作 量 与 解 原 问题 
具有 相隔 的 复杂 度 ， 这 是 因为 计算 一 个 结 点 的 代价 通常 要 搜索 包含 一 个 管 案 结 点 的 子 树 x 
才能 确定 ， 而 这 正 是 解决 此 问题 所 要 做 的 搜索 工作 ， 因 此 要 得 到 精确 的 代价 函数 一 般 是 不 
现实 的 。 

切合 实际 的 作法 是 给 出 一 个 便于 计算 代价 估计 值 的 两 数 g(z)= S aE), X 
中 8(z) 是 由 到达 一 个 答案 结 点 所 需 做 的 附加 工作 的 估计 通 数 ;让 ) 坟 0 J&— e HERE 
数 。 B+ )=0， 则 可 能 会 导致 偏向 于 作 纵深 检查 ， 使 用 代价 估计 值 函数 g(x) 选 择 下 一 
个 E- 结 点 的 搜索 策略 总 是 选取 g(， ) 值 最 小 的 活 结 点 作为 下 一 个 EB- 结 点 ， 称 之 为 最 小 代 
价 搜 索 (Least-Cost Search)， 简 称 LC~ 搜 索 ， 或 者 叫做 最 好 优先 搜索 (Best-First 
Search)。 可 以 选用 堆 结 构 (min 堆 ) 来 保存 活 结 点 表 ， 

在 求解 8- 迹 问题 中 ， 给 出 任意 一 个 初始 的 状态 ， 人 们 总 是 企图 用 尽 可 能 少 的 合法 移 
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动 次 数 达到 目标 状态 @。 我 们 令 了 (h(x)) 为 从 根 结 点 到 结 点 x 的 移动 次 数 ; 令 d(x) 为 x 
所 代表 的 状态 中 ， 所 有 错位 的 牌 和 它 的 正确 位 置 之 间 的 曼 哈 坦 距离 (Manhattan Dis- 
tance), HERE: (x171) 与 (x2,5) 的 曲 险 坦 距 离 为 |x1 一 yi+|x2-y2|， 和 使 用 这 样 的 估计 函数 
A(x) 一 了 (h(x))+d(x)， 使 得 我 们 能 尽 可 能 集中 地 搜索 那些 能 较 快 达到 目标 状态 的 子 树 ， 任 
何 时候 都 从 具有 最 小 函数 值 的 结 点 开始 搜索 ， 如 果 两 个 结 点 具有 相同 的 了 数值， 那么 先 检 
测 离 根 结 点 较 远 的 结 点 。 如 果 离 根 结 点 距离 相 局 的 两 个 结 点 具有 相同 的 函数 值 ， 那 么 选择 
其 中 的 任 一 结 点 搜索 。 搜 索 过 程 如 图 13.7 所 示 。 结 点 旁边 园 图 内 的 数字 为 a(，) 的 值 .和 
宽度 优先 搜索 法 相 比 ，LC- 搜 索 法 所 需 检测 的 结 点 数目 少 得 多 . 


图 13.7 解 8- 迹 问题 的 LC- 搜 索 


13.2.2 分 枝 限 界 方法 

现在 我 们 正式 地 定义 分 枝 限界 方法 。 给 出 一 个 初始 问题 和 一 些 想 获得 最 小 值 的 目标 阔 
数 /后 ， 分 枝 限界 算法 企图 直接 了 当地 解决 之 ， 如 果 问 题 太 大 ， 不 能 马上 解决 ， 便 将 其 分 
解 为 两 个 或 多 个 规模 较 小 的 子 问 题 ， 每 个 子 问题 包含 有 一 定 的 约束 条 件 。 分 解 过 程 重复 进 
行 ， 直 到 每 个 未 解决 的 子 问题 被 分 解 、 或 者 被 解决 ， 或 者 被 认为 不 可 能 引出 原始 问题 的 最 
优 解 为 止 . 


他 有 的 初始 状态 无 钴 ， 永 远 达 不 到 目标 状态 
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在 8- 谜 例子 中 ， 问 题 是 要 将 牌 按 行 主 次 序 置 人 棋盘 。 目标 函 数 /为 将 牌 排列 好 所 需 
的 移动 次 数 。 如 果 仅 有 一 次 移动 便 可 将 牌 排列 好 ， 那 么 算法 立即 将 问题 解决 ， 否 则 将 问题 
分 解 生成 若干 个 子 问 题 ， 对 应 于 每 一 个 合法 的 移动 ， 生 成 一 个 子 问 题 . 

正如 我 们 在 8- 谜 问题 已 经 看 到 的 那样 ， 适 用 于 原始 问题 的 分 解 过 程 ， 可 以 用 一 棵 有 
根 的 树 来 表示 ， 称 作 状 态 空间 树 。 这 樟树 的 结 点 对 应 于 分 解 的 子 问题 ， 而 树 的 边 对 应 于 分 
解 过 程 。 原 始 问 题 是 树 的 根 ， 树 的 叶 结 点 是 那些 可 解 的 或 不 能 进一步 分 解 所 抛弃 的 问题 . 

应 当 注 意 ， 分 枝 限 界 树 和 分 治 法 表示 的 树 有 两 点 重要 的 差别 ， 首 先 ， 分 枝 限 界 树 是 或 
dd (参见 图 13.1)， 它 表示 任 一 个 问题 的 解 是 原始 问题 的 一 个 解 ， 因 此 ， 不 需要 检测 整 棵 
状态 空间 树 ; 其 次 ， 分 枝 限 漠 算 法 表示 的 树 可 以 是 无 限 的 ， 它 表明 分 枝 限 界 算法 没有 找到 
解答 。 

分 枝 限 界 方法 的 目标 是 通过 检测 状态 树 中 的 少量 子 树 达到 问题 求 饼 。 设 期 望 的 最 小 代 
价 解 是 P. 对 每 个 分 解 的 子 问 题 ， 计 算 下 界 函 数 g， 这 个 下 界 在 给 出 子 问题 的 约束 后 ， 表 
示 该 子 问题 可 能 的 最 小 代价 艇 。 FRR BC g(x) 具 有 以 下 的 性 质 : 

(0) g 是 一 个 非 降 函 数 。 即 在 状态 空间 树 Tp. 3v y ex SELF. WE eG) a(x): 

(2) 在 每 一 个 表示 可 行 解 的 叶 结 点 x 上 ，g(x)= Kxy 

(3) 叶 结 点 表示 非 可 行 解 时 ，g = cc。 


图 13.8 是 状 仿 空间 树 的 另 一 个 例子 ， 结 点 
里 面 的 值 是 相应 子 问题 的 下 眶 。 对 应 于 可 行 
解 的 结 点 用 粗 园 圈 标 明 。 这 个 例子 代表 的 问 
题 其 代价 为 18， 即 广 的 值 是 18. 

在 分 梳 限 办 算法 的 执行 过 程 中 ， 任 意 一 
个 活 结 点 都 存在 一 个 问题 的 集合 ， 这 个 集合 
中 的 问题 已 经 生成 但 尚未 检测 ， 搜 索 策 妾 就 
是 确定 未 检测 的 子 问题 的 检测 次 序 ， 最 好 优 

图 13.8 最 好 优先 搜索 的 状态 空间 树 示例 先 〈 最 好 限界 ) 搜索 策略 使 用 最 小 下 界 来 挑 
选 未 检测 的 子 问题 图 13.8 中 结 点 近 旁 的 数字 标明 了 最 好 优先 搜索 策略 检测 结 点 的 次 序 

下 面 我 们 形式 化 地 描述 分 枝 限 界 算法 过 程 . 


算法 132 BRANCH-AND-BOUND ALGORITHM 
procedure B&B(T,f g,z); 
/ * 了 是 状态 空间 树 ， 其 根 root 为 输入 的 原始 问题 ; /是 输入 的 目标 函数 ; 8 是 输入 
FRERE. z 是 输出 的 最 优 值 ，* / 

begin 
{1) active_node_set+-froot}; / * 初始 化 * / 
(2) if root is a solution node then z«—f (root) else z-—o endif; 

/ 送 当 前 最 优 解 值 * / 
(3) while active_node__set containsa node x with g(x)<z de 
x*-node in active node with ming( ); / * 选择 扩展 结 点 * / 
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delete x from active node set; 
for cach child y of x do fA ERA xt/ 
if y isasolution &(f(y)«z) then z-—/(y) endif, / * 送 当前 最 优 解 值 * / 
ify isnotaleaf&(g(y)«z) then add y to active. node sci endif 
endfor 
endwhile 
end. 


算法 开始 时 ， 表 示 苦 始 问题 的 根 是 唯一 的 活 结 点 ， 把 root 置 人 活 结 点 集合 。 扩 展 结 
点 x 的 意思 是 : 对 x 的 每 一 个 孩子 ; 1) 检查 ”是否 是 一 个 解 结 点 ? 若是 ， 则 合理 地 修正 
当前 的 最 优 解 值 ; 2) 若 下 界 值 小 于 当前 的 最 优 解 值 ( 即 是 g(y)<z) Hy 不 是 时 结 点 ， 则 
把 ?加 到 活 结 点 集合 中 去 。 因 为 扩展 叶 结 点 是 无 意义 的 ， 所 以 不 能 把 时 结 点 加 进 活 结 点 集 
合 . 这样， 当前 的 最 优 解 值 越 来 越 小 。 一 旦 发 现 新 的 解 结 点 时 ， 疹 它 的 当前 最 优 解 什 
f(y) 小 于 z， 则 立即 进行 修正 ， 最 后 得 到 的 z 值 就 是 最 优 解 值 。 对 每 个 活 结 点 y， 算 法 继 
续 执 行 ， 直 到 e(y)> 2 时 算法 终止. 

总 之 ， 分 枝 限 界 算法 可 以 表征 为 : 如何 生 成子 问题 ， 如 何 选择 一 个 特殊 的 子 问题 作为 
继续 搜索 的 出 发 点 ; 如 何 抛弃 绝望 的 子 问题 ;如 何 终止 算法 的 执行 ， 这 些 步骤 中 的 任何 一 
个 都 可 以 并 行 地 实现 。 


13.2.3 ”旅行 商 问 题 (TSP) 

旅行 高 问题 (Traveling Salesperson Problem) 简 记 作 TSP， 它 是 实际 应 用 中 出 现 复杂 问 
题 的 集中 概括 和 简化 形式 ， 是 一 个 比较 有 趣 、 容 易 定义 和 难于 处 理 的 问题 ， 属 上 NP- 完 
全 问题 . 

1， 问题 描述 

d G-(V,E» V-[12,-,0J&— NAAN, C fe] 是 关于 这 个 图 的 代价 矩阵 ， 
Ho BUG DMR. SAG €E,. MR cj= ce， 并 规定 所 有 的 cv= ce， 不 失 一 般 
性 ， 可 以 设 一 切 周游 路 线 以 顶点 1 为 起 始点 。 问题 是 要 从 图 G 中 找 出 一 条 代价 最 小 的 周 
游 路 线 (TouD， 

为 了 应 用 分 枝 限界 法 ， 我 们 必须 定义 问题 的 代价 函数 〈 旨 标 函 数 ) fC > ) 和 下 界 
函数 gC )(“ "表示 变 是 为 线 点 ) ， 使 得 对 状态 空间 树 上 任何 结 点 满足 &*)s f+) 
其 中 A(，) 的 定义 各 8- 迹 问题 一 样 ， 下 界 函 数 我 们 采用 归 约 矩阵 的 方法 来 定义 。 

2 归 约 矩阵 由 

从 代价 矩阵 的 任何 -- 行 〈 或 列 ) 的 各 元 素 中 ， 减 去 这 一 行 《 或 列 ) 中 的 最 小 元 素 ， 称 
之 为 对 行 〔 或 列 ) Jae (Reduction), 38:17 (或 第 了 列 ) 中 各 元 素 减 去 的 最 小 数 rA (或 
rQG» PER iti GRIS j 列 ) 的 约 数 ， 如 果 一 个 矩阵 的 各 行 、 各 列 都 是 昭 约 了 的 ， 那 
么 我 们 称 这 个 矩阵 为 归 约 矩阵 (Reduced Matrix). #1% 


r= Xn Xr) 
称 作 矩阵 C 的 约 数 ， 例 如 ， 图 13.9(a) MTA 5 e DUST CURRERE, D 13.905) 
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RENAE, HOME T = 25, 
r(1)2 10 


œ- 20 30 10 11 o 1017 0 1 

15 co 16 4 2 12 œ 1 2 0 "(2-2 
3 50 2 4 0.32002 13)=2 
19 6 18 œ 3 15 3 12 œ 0 r(4)=3 
16 4 7 16 o 110 0 12 o r(5)4 


r()-1 r(3-3 
r2)- r4) r(5)-0 
(s) RAPERE (9 归 的 矩阵 
图 13.9 代价 矩阵 C RHE C 


对 任何 一 个 给 定 的 代价 矩阵 C， 求 它 的 最 小 代价 周游 路 线 的 问题 ， 等 价 于 求 它 的 归 约 

JERE C' 的 最 小 代价 周游 路 线 问题 ， 即 有 如 下 定理 。 
定理 13.1 给 定 一 个 图 G 和 它 的 代价 矩阵 C=[cij， 设 PP 是 G 中 任 一 条 局 游 路 线 ， 
BA 

PR nl P 
这 里 C= [e^] Jé C 的 归 约 矩阵 ，r 是 它 的 约 数 ， 
证 明 因为 任何 一 条 周游 路 线 P 都 必须 包含 条 边 ， 这 些 边 (i 所 对 应 的 元 家 ci 必须 是 每 
行 和 每 列 有 一 个 且 仅 有 一 个 @、 如 果 边 (bje P， 那 么 c VAT P 的 代价 中 ， 且 在 第 i 行 和 
第 j 列 再 不 会 有 其 它 元 素 被 计 入 路径 了 的 代价 中 。 因 为 

eu = cy = up) = ry) 
Bp 

e, 7 eye ri rr) 
XIBCÉ I DEP, HNUR TEBTTI SUL SUR TCE BREBUPE AGAR BLADE PB. MA 
A 


3， 动 态 状态 空间 树 

假设 图 G={ 广 B 有 严 条 边 ， 那 么 周游 路 线 含有 这 m 条 边 中 的 n RA A M. 
我 们 将 旅行 商 问 题 的 状态 空间 树 动态 地 构造 成 一 哥 二 元 树 ， 树 中 结 点 的 左 分 枝 表 示 
周游 路 线 中 包含 一 条 指定 的 边 ， 右 分 枝 表示 不 包含 该 条 边 . 这 样 ， 在 左 子 树 中 找 周 
游 路 线 ， 只 需 再 选取 ”-1 条 边 ， 而 右 子 树 则 需 对 边 作 次 选择 。 由 此 可 知 在 左 子 
树 中 求 最 优 解 比 在 右 子 树 中 容易 。 所 以 我 们 希望 能 选取 一 条 最 有 可 能 在 最 小 代价 周 
游 路 线 中 的 边 位 力作 为 这 条 “分 割 * 边 ， 一 般 所 采用 的 选择 规则 是 : 选取 一 条 使 其 右 


@@ 其 逆 不 一 定 为 真 . 
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子 树 具 有 最 大 8 值 的 边 。 使 用 这 种 选择 方法 可 以 尽快 得 到 那些 g 值 大 于 最 小 周游 代 
价 的 右 子 树 . 

对 于 问题 的 状态 空间 树 的 根 结 点 ， 显 然 ， 其 下 界 
R(root)=7 是 正确 的 ， 因 为 任何 一 条 周游 路 线 的 代价 不 可 
能 小 于 r。 下 面 ， 要 给 状态 空间 树 上 的 每 一 个 结 点 建立 一 
个 相应 的 归 约 代价 矩阵 ， 设 AL. Ba M + 是 状态 树 上 结 
点 包 所 对 应 的 归 约 和 矩阵、 下界 函数 和 约 数 . x 是 w HK 
T. 若 将 边 (i 了 加 入 周游 路 线 ( 即 x 是 o 的 左 孩 子 )， 则 
计算 x 的 归 约 矩阵 4,， 先 从 A, 中 将 第 i 行 和 第 j 列 的 元 
素 置 成 = ， 且 把 一 切 与 前 面 选 定 的 路 线 构 成 回路 的 那些 边 
所 对 应 的 元 素 置 成 ce。 然 后 ， 将 所 得 的 矩阵 进行 归 约 ， 就 
是 归 约 矩阵 A, Ar, 用 上 面 的 公式 计算 。 下界 函数 
R(X) 的 计算 公式 是 : 图 13.10 针对 图 13.9(a) 所 未 

a(x)= alo) + 4,  r, 代价 敌阵 的 状态 空间 树 
若 x 是 wm 的 有 孩子 ， 周 游 路 线 中 不 包含 边 (i 加 则 将 元 罕 
Ali ERO. EHAE A, 的 第 i 行 和 第 j 列 ， 即 是 归 约 矩阵 4*。 计 算出 A, 的 约 数 
rx 后 ， 则 下 界 函 数 计算 公式 为 : 


E) 


(x)= g(o)+r', 
4 最 小 代价 分 核 限界 算法 的 高 层 搭 述 


算法 133 TRAVELING SALESPERSON ALGORITHM (SISD) 
输入 : RAMEN C 
输出 : 旅行 商 的 最 小 代价 周游 路 线 。 
begin 
reduce cost matrix, determining the root’s lower bound ; 
initially only the root is in the state space tree ; 
/ * 根 表 示 所 有 可 能 的 周游 路 线 的 全 合 * / 
while truc do 
select unexamined node in the state space tree with the smallest 
lower bound ; 
if the node represents a tour. then exit the loop endif ; 
select the edge whose exclusion increases the lower bound the most; 
for the two cases representing the inclusion and 
exclusion of the selected cdge do 
create a child node with the correct constraint, 
find the lower bound for the child node 
endfor 
endwhile 
end. 
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对 于 图 13.9(a) 中 的 代价 矩阵 ， 算 法 13.3 所 形成 的 动态 状态 空间 树 如 图 13.10 BER. 
根 结 点 的 归 约 代价 矩阵 见 图 13.9(b)， 其 余 各 点 的 归 约 代价 矩阵 分 别 列 出 如 下 : 


vo 10 0 1 o 1017 0 1 
oo ill 2 0 | i œ 11 2 0 | 
结 点 2 © co © co © 结 点 3 o 3002 
o 3 12o 0 4 3 12o 0 
v 0 0 12 c Lo 00 12m 
© 7 o 0 c fo 10 o 0 1] 
€ 00 2 0 o 0020 
结 点 4 oD © o co 结 点 5 o 00 © o om 
o 0 o coc 0 o 3 100 
€ © © © o0 Lo 0 o 12 c | 
© © c c om [o 0 co o o] 
9 o o c 0 ooo 0 0 
结 点 6 © © © o co 结 点 7 o © © © © 
o 0 co c c o 0 wo o 0 
o o0 oo © om oe co c © coo 


值得 指出 : 图 13.10 的 状态 树 并 没 画 完 余 。 因 为 从 结 点 6 往 下 扩展 ， 内 有 两 层 就 是 最 优 解 
管 的 叶 结 点 ， 可 以 对 以 结 点 6 为 根 的 子 树 中 结 点 逐个 检测 求解 ， 比 计算 归 约 矩阵 方法 效率 
高 些 ， 对 那些 矩阵 阶 数 高 的 问题 ， 在 “靠近 "解答 结 点 和 * 没 靠近 "解答 结 点 分 别 做 不 同 的 处 
理 ， 效 果 会 更 加 明显 . 

5. 两 种 并 行 的 旅行 商 问题 算法 

Mohanbne 设 计 出 了 旅行 商 算法 的 两 种 并 行 化 处 理 . 第 一 种 是 对 for 循环 实现 并 行 
化 ， 即 并 行 处 理 某 个 结 点 的 各 个 分 枝 ; 第 二 种 是 并 行 地 执行 while 循环 ， 即 并 行 处 理 
多 个 结 点 。 

前 面 我 们 用 分 枝 限 界 法 求解 TSP 时 ， 建 立 了 一 樟 二 元 树 ， 该 树 可 用 一 个 处 理 器 来 并 
行 处 理 每 一 个 结 点 ， 也 就 是 说 ， 该 状态 树 自然 地 具有 二 的 并 行 度 ， 如 果 同 时 选择 Ic AUI 
来 决定 其 取 会 ， 那 么 对 每 个 结 点 将 有 2+ 个 孩子 ， 需 要 2* 个 处 理 器 来 并 行 计 算 ， 下 而 我 们 
给 出 相应 的 算法 . 


算法 13.4 TRAVELING SALESPERSON ALGORITHM (TIGHTLY COUPLED 
MULTIPROCESSOR) 
输入 : RAE C; 
输出 : 旅行 商 的 最 小 代价 周游 路 线 。 
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begin 
reduce cost matrix, determining the root’s lower bound; 
initially only the root is in the state space tree; 
while true do 
select the unexamined node in the state space tree with the smallest 
lower bound; 
if the node represents a tour then exit the loop endif; 
select the & edges whose exclusion increases the lower bound the most; 
for the 2* cases representing all inclusion exclusion 
combinations of the selected edges pardo 
create a child node with the correct constraints; 
find the lower bound for the child node 
endfor 
endwhile 
end. 


第 二 种 并 行 算法 产生 若干 进程 ， 异 步 地 检查 子 问题 所 对 应 的 子 树 ， 直 到 找到 解答 为 
db. 每 个 进程 重复 地 从 未 检查 的 子 问题 的 有 序 表 中 移出 下 界 最 小 者 ; 将 问题 分 解 之 《除非 
它 能 直接 求解 ); 并 将 新 产生 的 两 个 子 问题 插 人 到 有 序 表 中 的 适当 位 置 上 ， 为 了 对 有 序 表 
进行 插入 和 删除 ， 进 程控 制 必须 具有 排 它 人 性 ， 即 不 允许 两 个 进程 同时 访问 有 序 表 中 的 某 项 
内 容 ， 做 这 些 工作 占用 的 时 间 相 对 地 小 于 问题 分 解 所 需 的 时 间 ， 因 此 ， 有 序 吉 的 争夺 不 应 
该 成 为 速度 倍数 (加 速 比 ) 的 重要 障碍 。 

图 13.11 列 出 了 在 Cz, 上 的 两 种 并 
行 算法 的 速度 倍数 的 对 比 . 求解 的 
TSP 具有 30 个 顶点 。 算 法 1 只 达到 了 
很 低 的 速度 倍数 ， 这 是 因为 增加 的 处 
理 器 花费 了 大 部 份 时 间 在 生成 那些 永 
远 不 会 延伸 的 结 点 上 (它们 的 下 界 太 et $ 
高 ) . 使 用 16 个 处 理 器 时 ， 算 法 2 达 处 理 机 数 
到 的 速度 倍数 约 等 于 8。 得 不 到 较 高 
速度 倍数 的 障碍 主要 在 于 资源 共享 ， 图 13.11 两 种 并 行 算法 的 速度 倍数 
即 是 内 部 群集 器 (Intraclusten) 争 夺 共 享 资源 ， 或 计算 机 模块 里 面 的 群集 器 争夺 共享 资源 、 这 些 
资源 包括 Kmap、Map 总 线 和 目标 管理 程序 。 而 目标 管理 程序 常常 用 于 产生 搜索 树 的 结 点 。 


13.2.4 ”并行 分 枝 限界 算法 的 异常 情况 


前 面 我 们 介绍 了 LC 分 枝 限 界 法 ， 叙 述 了 分 枝 跟 界 算法 的 并 行 化 ， 这 里 着 重 论述 并 行 
最 小 代价 分 枝 限界 执行 时 可 能 出 现 的 异常 情况 和 一 般 情况 下 的 效率 问题 pn 
为 了 论述 方便 ， 我 们 假定 最 小 化 目标 函数 为 f(x). 令 其 最 优 解 值 为 。 在 状态 空间 
树 中 每 一 个 结 点 x， 令 Luo) min[/ (2: z 是 子 树 x 中 的 可 行 解 }， 若 不 存在 这 样 的 z， 
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Wik 2 


EK 


则 fam = 00, 

设 有 p 个 妊 理 器 可 以 利用 , 令 9=minfp， 活 结 点 个 数 }， 则 4 个 结 点 选 作 为 下 一 批 的 
E-A (扩展 结 点 )， 令 Ran 为 这 4 个 结 点 中 最 小 的 g( ME. BRE EE- 结 点 中 茶 个 结 点 
为 解答 结 点 且 其 g( )= gea， 则 最 小 代价 解 便 已 找到 ; 否则 ， 这 9 个 E- 结 点 被 扩展 (一 个 
处 理 器 扩展 一 个 孔 - 结 点 )， 它 们 的 孩子 加 入 到 活 结 点 表 中 。 这 样 的 9 个 EE- 结 点 的 一 次 扩 
展 称 为 最 小 代价 分 枝 限 界 并 行 算法 的 一 次 迭代 , 

对 于 给 定 的 问题 ， 前 面 叙述 了 下 界 函 数 满足 的 性 质 ， 在 这 里 再 加 上 一 条 ， 加 上 的 这 条 
性 质 ， 对 于 邻近 解 结 点 的 祖先 来 说 往往 是 成 立 的 事实 上 许多 非 解 答 结 点 可 能 具有 与 最 优 
解 相同 的 值 ， 加 上 这 一 条 乃 属于 正常 现象 。 总 之 ， 下 界 函 数 g(x) 满 足下 述 5 条 性质 : 

(D g(x) < fax): x 为 状态 空间 树 中 任 一 结 点 ; 

Q) g(x)= Ax): x 为 可 行 解 结 点 〔( 即 解答 结 点 ); 

(3) g=: x 为 不 可 行 解 结 点 ; 

(4) gO)> ex); yx 的 孩子 ; 

(5) g( ) 值 可 以 相同 : 即 在 状态 空间 树 上 的 车 于 结 点 可 以 有 相同 的 下 界 函 数值 . 

此 外 ， 还 可 以 设置 最 小 代价 的 上 界 > 使 算法 进一步 加 速 . 若 w 是 最 小 代价 解 的 上 和 界 ， 
MRA g(x)}>w 的 所 有 活 结 点 x 可 以 被 抛弃 .初始 时 ，w 的 值 可 以 置 成 coo， 以 后 再 修改 
之 ， 比 如 找到 可 行 解 结 点 x 时， 则 令 w= 了 (x) 的 值 ， 若 有 更 小 的 可 行 解 值 ， 则 青 修改 u 

在 状态 空间 树 中 ， 结 点 x 称 为 临界 的 (Critical) 结 点 当 且 仅 当 g(x)<f。 令 ËR p 

个 处 理 器 可 用 时 所 需 的 选 代 次 数 。 则 有 以 下 的 诸 定 理 , 
定理 13.2 给 出 症 < 到 和 大 >0， 则 存在 一 棵 状态 空间 树 使 得 KI) <n). 
证 明 ”考虑 图 13.12 所 示 的 状态 空间 树 ， 所 有 非 叶 结 点 的 g 值 等 于 最 小 代价 解答 结 点 ( 结 
点 4) KES. SEN 个 处 理 器 时 ， 第 一 次 迭代 中 ， 某 个 处 理 器 将 根 结 点 扩展 ， 在 第 
二 层 上 产生 ntl 个 活 结 点 。 候 定 在 第 二 次 迄 代 时 ， 第 二 层 左 边 的 ny 个 结 点 被 扩展 ， 产 生 
n 个 子 结 点 ， 其 中 nct 个 因 超 界 而 被 抛弃 ， 仅 剩 下 一 个 是 活 结 点 .第 三 次 渤 代 时 这 个 活 
结 点 与 结 点 B (在 第 二 层 ) 一 道 被 扩展 ， 第 三 层 上 的 这 个 活 结 点 产生 一 个 解 等 结 点 4， 算 
法 终止 。 故 Kon)= 3， 


图 13.12 定理 13.2 的 实例 
如 果 使 用 ny 个 处 理 器 ， 第 一 次 迁 代 情况 与 上 面 一 样 ， 产 生 nt APH, nt 
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ACT RREALKERMNSMT RE. FRERBSR LEE ntl 个 活 结 点 ， 共 有 ath, 
个 活 结 点 。 显然 ， 第 三 次 迭代 只 能 扩展 内 个 活 结 点 ， 完 全 可 能 是 右边 的 加 个 结 点 被 扩 
展 。 接 下 去 继续 进行 迭代 ， 第 4，5，…， 隐 次 迭代 完全 限制 在 根 结 点 的 最 右 子 树 上 ， 最 
后 在 第 (3k+1) 次 选 代 时 ， 最 小 代价 解 结 点 4 才能 创建 ， 因 此 1) = 3-1. 

对 比 两 种 结果 ， 我 们 得 到 km) < Ln). 

这 个 定理 告诉 我 们 ， 执 行 并 行 最 小 代价 分 枝 限 算法 ， 增 加 处 理 器 不 一 定 都 是 有 效 的 
这 是 因为 增加 处 理 器 后 ， 可 能 导致 狐 似 理想 的 结 点 的 生成 ， 从 而 导致 相当 数量 或 所 有 处 理 
器 去 搜索 其 子 树 却 又 一 无 所 得 。 当 处 理 器 个 数 较 少时 ， 过 到 貌似 理想 的 结 点 x 被 扩展 
m, ER u 已 经 修改 且 u< g(x)， 所 以 会 抛弃 结 点 x， 执行 时 辣 反 而 少 。 

当 存 在 大 量 结 点 的 8 值 等 于 了 时， 定理 13.2 指出 可 能 出 现 异 常情 况 . 事实 上 ， 即 使 
只 有 一 个 处 理 器 处 理 这 样 的 结 点 ， 也 可 能 会 引起 麻烦 。 如 果 我 们 要 求 只 有 最 小 代价 解答 结 
点 才能 有 等 于 了 的 8 值 ， 那 么 定理 13.2 RRL, HIE, n=l, MAE n 的 
增加 不 会 引起 迭代 次 数 的 增加 ， 这 就 是 下 一 条 定理 要 证 明 的 结论 . 
定理 13.3 如果 x 不 是 解答 结 点 时 有 g(x) 了， 那么 对 所 有 n>1 有 1)> An). 
证 明 ” 当 使 用 一 个 处 理 器 时 ， 只 有 临界 结 点 和 最 小 代价 解答 结 点 才能 成 为 E- 结 点 ， 这 是 
为 任何 时 候选 择 一 个 忆 - 结 点 时 ， 活 结 点 表 中 肯定 至 少 有 一 个 结 点 x 满足 g(x)}< f. 
且 在 算法 终止 之 前 ， 任 何 临界 结 点 将 成 为 E~ 结 点 。 所 以 ， 车 临界 结 点 共有 m 个 ， 则 
HD)=m. 

当 使 用 n 个 处 理 器 时 (n> D)， 一 些 非 临界 结 点 将 成 为 也 ~- 结 点 .但 每 次 迭代 中 至 少 有 
PEE AER, BU) < m。 因 此 KD)< I). 

下 面 的 定理 证 明 : 为 了 找 一 个 解答 结 点 ， 增 加 处 理 器 的 数 利 ， 实 际 上 可 能 导致 兴 代 次 
数 的 不 成 比例 的 减少 。 
定理 13.4 车 给 出 acm 和 > za/ rn， 则 存在 一 棵 状态 空间 树 使 得 Un) / Km) 之 
k>n/ n. 
证 明 ”参见 Lai 和 Sahni Hig, 
定理 13.5 如果 x REBUM ERA OAS IAM n> 1 有 TD7 Io) n. 
证 明 ”由 定理 13.3 的 证 明 可 知 ; =m, Hp m 是 临界 结 点 数 ; 因为 所 有 临界 结 点 在 算 
法 终止 时 必须 变 成 为 E- MA Hn)> m/ n。 因 此 I0) / o « n. 

Lai 和 Sahni 在 某 些 0/ 1 背包 问题 的 实例 中 已 发 现 异 常 性 质 ， 但 是 他 们 得 到 的 结论 
是 : 异常 性 质 实践 中 很 少 出 现 ， 而 且 通 常 是 ，(1) 假定 问题 足够 大 时 ， 增 加 处 理 器 数目 不 
会 增加 执行 时 间 ; (2) 不 可 能 指望 超 线性 的 这 度 们 数 . 


133 a-B 搜索 


国际 象棋 、 围 棋 、 五 子 棋 和 中 国人 象 棋 都 局 于 二 人 零 和 博弈 ， 这 种 博 弃 由 两 个 选手 对 
弈 ， 两 人 依次 走 子 ， 一 个 选手 的 损失 是 另 一 个 选手 的 受益 ， 反 之 亦 然 ， 最 后 结果 是 一 位 选 
手 赢 、 另 一 位 选手 输 ， 或 者 双方 认 和 .博弈 是 一 种 竞争 ， 竞 争 现象 广泛 存在 于 社会 活动 的 
许多 方面 ， 例 如 ， 政 治 、 经 济 、 军 事 、 外 交 、 科 技 等 领域 都 存在 着 竞争 现象 ， 
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在 计算 机 上 玩 博弈 要 在 博弈 树 上 进行 搜索 ， 以 确定 下 一 步 如 何 行动 域 有 利 ， 溥 弈 树 是 
一 棵 与 / 或 树 ， 树 中 结 点 代表 横 盘 位 置 (Position)， 根 结 点 代表 当前 的 棋盘 位 置 ， 边 代表 
移动 (Move) 棋 子 。 除了 根 结 点 ， 其 余 结 点 都 是 在 搜索 过 程 中 动态 地 生成 和 删除 博弈 树 
的 搜索 是 运用 修剪 来 减少 计算 量 。 它 的 修剪 方式 称 为 ap 修 草 (a~8 Pruning). a-8 搜索 
算法 运用 上 、 下 界 和 自 底 向 上 计算 得 到 的 求 值 函数 〈 启 发 函数 ) 值 比较 ， 去 掉 超 出 界限 的 
结 点 ， 即 是 说 ， 该 算法 一 旦 确定 某 子 树 与 搜索 结果 无 关 时 ， 就 将 该 子 树 前 去， 这 样 可 以 加 
快 搜索 速度 . 

下 面 ， 我 们 先 介绍 串 行 的 w~ 有 算法 及 其 改进 技术 ， 这 些 改 进 技术 的 目的 相同 ,都 是 
希望 尽早 更 多 地 剪 掉 与 搜索 结果 无 关 的 子 树 。 然 后 介绍 并 行 的 a-8 算法 ， 并 行 算法 采用 
了 某 些 改 进 技术 。 一 般 地 说 ， 大 个 处 理 器 并 行 执行 算法 并 不 能 得 到 大 倍 的 速度 倍数 ， 这 是 
因为 并 行 机 制 引信 了 其 它 额外 开销 ， 其 中 最 主要 的 是 通信 开销 {Communication 
Overhead) 和 搜索 开销 (Search Overhead). AWARE, SAMs RRA, x 
方面 的 开销 叫做 通信 开销 。 由 于 使 用 并 行 技 术 ， 在 并 行 搜索 时 会 出 现 匈 余 搜 索 ， 艺 一 些 在 
串 行 搜索 时 被 剪 去 的 子 树 在 并 行 搜索 中 会 进行 搜索 .这 方面 的 开销 叫做 搜索 开销 。 通 常 ， 
通信 开销 和 搜索 开销 成 反比 关系 ， 壮 少 通信 开销 就 增加 搜索 开销 ， 减 少 搜索 开销 就 增加 首 
信 开 销 ， 各 种 并 行 算法 按照 合理 的 硬 ， 软 件 配置 ， 折 衷 综合 两 种 开销 的 影响 ， 得 到 不 同 的 
搜索 性 能 指标 ， 取 得 了 满意 的 结果 . 


13.3.1 a-f 算法 


MMS MWR, MMAR, MOR RR. 0-8 算法 力图 避 
免 搜 索 那 些 与 结果 无 关 的 子 树 ， 导 致 搜索 深度 的 加 深 。 下面 描述 的 -8 算法 中 包含 四 个 
变 参 数 ; 一 当前 的 位 置 ; alpha 和 beta 一 搜索 取 值 的 范围 depth 一 搜索 的 深度 .算法 用 
函数 形式 给 出 ， 它 返回 位 置 p 的 最 小 最 大 值 ， 算 法 中 调用 四 个 函数 : 即 求 值 函数 EVAL- 
UATE， 生 成 结 点 函数 GENERATE， 做 移动 函数 MAKE APH BAK UNDO。 这 个 
算法 的 优点 是 : 姐 需 明显 的 测试 淮 在 进行 移动 ， 才 能 使 其 达到 最 小 值 和 最 大 值 . 


算法 135 ALPHA-BETA ALGORITHM(SISD) 
function ALPHA. BETA(p, alpha, beta, depth), 
begin 
if depth 0 à 
then return(EVALUATE(p)) / * 求 终端 结 点 的 值 w / 
else 
width«-GENERATE(p)); 
S* ER POGBF ps + Pua Width 是 合法 的 移动 数 * / 
if width=0 


定 增加 取胜 的 可 能 性 。 
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then return (EVALUATE (p). / * 没有 合法 的 移动 / 
else 
Score«-alpha; 
for i--1to width do 
MAKE(p); / * HASH / 
values+-ALPHA__BETA(p,—beta—score,de pth-1); 
UNDO(p); / 不 做 移动 * / 
if value> score then score-—value endif; / + 已 找到 较 好 的 移动 * / 
M score> beta then return(score) endif / * BARAK / 
endfor 
endif 
endif ; 
return(score) 
end. 


为 了 说 明 算法 13.5 的 执行 过 程 ， 考 虐 图 13.13 所 示 的 博弈 树 ， 树 中 每 条 边 上 的 一 对 
数 分 别 表示 双亲 结 点 传送 给 它 的 孩子 结 点 的 alpha 和 beta 值 ， 但 传送 给 叶 结 点 的 值 没 有 
标明 ， 这 是 因为 它们 是 不 相关 的 。 若 depth < 0， 则 求 值 函数 往往 确定 了 位 置 的 值 ， 且 这 
个 值 立即 返回 给 双亲 结 点 。 结 点 中 的 数字 是 求 值 函 数 的 值 ， 它 们 是 按照 先 移动 的 弈 考 画 出 
的 。 从 根 结 点 开始 ， 奇 数 层 为 先 移动 弈 者 的 值 ， 偶 数 层 为 对 手 的 值 。 


Sp 


图 1343 g- 搜索 的 例子 


每 一 个 内 部 结 点 表示 博弈 中 的 一 个 位 置 ， 当 搜索 到 达 某 个 内 部 结 点 时 ， 由 于 前 面 已 经 
考虑 过 的 移动 选择 至 少 使 弈 者 领先 alpha 值 ， 而 对 手 决 不 允许 从 当前 位 置 让 弈 者 获得 大 于 
beta 值 ， 因 此 alpha 和 beta 决定 了 搜索 的 一 个 窗口 若 从 这 个 位 置 出 发 不 能 导致 值 大 于 
alpha 的 移动 ， 则 斌 者 将 不 跟着 进行 活动 。 若 任何 移动 导致 其 值 大 于 beta, WARNE 
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将 确信 决 不 能 到 达 这 个 位 置 。 于 是 算法 03.5 找 出 孩子 结 点 返回 的 负 值 中 的 最 大 值 。 但 
是 ， 若 任何 返回 值 的 负数 大 于 beta， 则 搜索 停止 且 修 剪 剩 余部 分 。 


13.3.2 改进 的 a-p 搜索 
这 里 我 们 简单 地 叙述 改进 算法 的 基本 思想 ， 详 细 算法 参见 文献 [2 


1 吸出 搜索 (Aspiration Search) 

如 上 所 述 ，a-8 算法 定义 了 一 个 窗口 ， 记 作 (x，8)。 窗 口 越 小 ， 搜 索 时 可 能 被 前 掉 
的 子 树 越 多 ， 搜 索 速度 越 快 。 在 实际 应 用 中 ， 为 了 得 到 正确 的 根 值 ， 初 始 窗口 可 选用 
CINFEINF) XE INF 是 求 值 函数 可 能 返回 的 最 大 值 。 

吸出 算法 的 思想 是 使 用 小 窗口 来 加 速 搜索 。 它 的 主要 步 台 如 下 : 

首先 用 某 种 方法 估计 根 值 及 其 误差 以 (U-e，U+s) 为 初始 窗口 ， 调 用 ob 算法 
搜索 博弈 树 。 若 返回 值 你 于 窗口 的 下 限 ， 则 用 (-INF,U-s) 作 为 窗口 重新 进行 -8 搜索 ; 
车 返回 值 高 于 窗口 的 上 限 ， 则 用 (V+s，INF) 作 为 窗口 重新 搜索 ， 如 此 继续 进行 ， 最 后 总 
能 得 到 正确 的 根 值 . 

储 考 缩小 窗口 节省 的 开销 大 于 重新 搜索 增加 的 开销 ， 则 搜索 速度 可 以 加 快 。 实 味 上 ， 
可 使 得 (Us，U+s) 比 (~INF，INF) 小 得 多 。 用 可 靠 方法 合计 根 值 和 误差 = 组 成 的 窗口 
(Us，U+s)， 包 含 真正 的 根 值 的 概率 也 较 大 ， 吸 出 搜索 是 比较 有 效 的 . 

2. 转换 表 (Transposition Table) 

转换 表 是 一 个 大 的 散 列表 ， 表 中 存 贮 那 些 已 被 搜索 过 的 结 点 和 相应 的 一 些 信息 .在 博 
弈 树 的 搜索 过 程 中 ， 当 搜索 到 某 个 结 点 时 ， 首 先 在 转换 表 中 检索 该 结 点 。 若 发 现 该 结 点 已 
经 搜索 过 ， 则 利用 表 中 存 贮 的 一 些 信息 来 加 速 对 以 该 结 点 为 根 的 子 树 的 搜索 ， 有 时 甚 室 可 
以 删除 该 子 树 ， 用 表 中 存 贮 的 以 前 搜索 的 结果 作为 本 次 搜索 的 结果 .由 于 在 搜索 一 标 博 弈 
树 时 ， 已 被 搜索 过 的 结 点 再 次 出 现 是 常 有 的 事 ， 特 别 是 使 用 杀手 启发 (Kiner Heuristic), 
选 代 深化 技术 时 ， 这 种 情况 更 是 常见 的 。 因 此， 转换 表 是 较 有 用 的 . 

使 用 转换 表 开销 小 ， 且 潜在 的 收益 大 ， 但 存在 着 存 贮 管理 问题 ， 另 外 ， 转 换 表 可 以 使 得 
博弈 树 更 加 有 序 ， 这 是 因为 车 发 现 结 点 已 被 搜索 过 ， 即 在 转换 表 中 检索 到 该 结 点 ， 则 可 以 先 
检查 表 中 记录 的 移动 ， 而 这 个 移动 很 可 能 是 最 好 的 移动 ， 因 为 它 是 前 面 的 搜索 找到 的 最 好 移 
3h. 

3， 选 代 深化 (Iterative Deepening) 

和 迭代 深化 是 指 进行 深度 为 D 层 的 搜索 之 前 先进 行 深度 为 D-1 层 的 搜索 ，D=2,3,… 
maxdepth， 其 中 maxdepth 是 最 大 搜索 深度 。 除 第 一 次 搜索 外 ， 每 次 搜索 都 要 利用 前 一 
次 搜索 的 结果 .利用 时 采取 的 方法 较 多 ,例如 ，D~1 层 深 的 搜索 结束 后 ， 保 留 主要 变量 
(Principal Variation)， 并 把 它 作为 D 层 深 搜索 的 初始 序列 ， 由 于 D-1 层 的 主要 变量 很 可 
能 是 D 层 主要 变 重 的 一 个 组 成 部 分 ， 因 而 D 层 搜索 可 以 快速 地 进行 又 如 ， 可 以 把 D- 
层 搜 索 得 到 的 根 值 作 为 对 D. 层 深 的 搜索 根 值 的 估计 值 ， 以 它 为 中 心 设置 一 个 狭 鹤 的 黎 
H, ARBAR D 层 深 的 搜索 ， 同 样 也 可 以 加 快 搜索 速度 ， 

迭代 深化 技术 的 主要 优点 有 两 个 : 其 一 是 便于 时 间 控制 .在 博弈 竞赛 中 ， 每 一 步 棋 允 
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此 ， 搜 索 深度 较 难 掌握 。 若 取得 太 小 ， 则 浪费 许多 时 间 ; 若 取 大 了 ， 则 搜索 某 些 树 时 会 出 
现时 间 限制 到 而 得 不 出 可 靠 的 搜索 结果 的 现象 ， 使 用 迭代 深化 搜索 时 ， 如 果 时 间 限制 到 时 
正在 进行 D 层 深 的 搜索 ， 那 么 至 少 可 以 保证 D-1 层 的 主要 变量 是 可 从 的 。 

其 二 是 迭代 深化 可 以 使 转换 表 或 杀手 表 充满 有 用 的 移动 和 相应 的 信息 。 若 迭代 深化 和 
转换 表 或 杀手 启发 结 台 作用 ， 则 可 更 加 提高 搜索 的 速度 ， 且 每 次 和 迭代 后 对 移动 进行 排序 ， 
可 使 得 博弈 树 更 加 有 序 ， 

4. 主要 变 最 搜索 (Principal Variation Search) 

ap 算法 的 一 个 有 趣 的 实现 是 用 一 种 特别 的 方法 处 理 第 一 个 变量 。 主 要 变量 搜索 (M 
记 作 PVS) 正 是 这 样 做 的 。 

PVS 的 基本 思想 是 : 假定 第 一 次 做 的 移动 在 每 个 结 点 上 是 好 的 ， 于 是 PVS 对 第 一 棵 
子 树 作 递 归 的 调用 ， 并 确定 它们 的 值 ， 其 余 的 子 树 依次 进行 检查 . 若 这 些 子 树 中 的 某 一 个 
有 值 大 于 当前 的 主要 变量 ， 则 将 它 作为 新 的 主要 变量 ， 并 用 正确 的 窗口 再 进行 搜索 ， 换 句 
话说 ， 一 旦 得 出 主要 变量 ， 就 用 最 小 窗口 {~score-1，-score) 搜 索 树 的 剩余 部 分 ， 这 里 
score 是 当前 找到 的 最 好 值 ， 如 果 发 现 子 树 中 某 一 棵 的 次 序 比 它 的 兄弟 次 序 好 ， 那 么 必须 
再 进行 搜索 ，PVS 对 好 的 有 序 ( 非 随机 ) 博弈 树 搜索 证 明 是 有 效 的 ， 当 迁 代 深化 常用 于 
提供 一 个 主要 变量 时 ，PVS PARMAR. 

由 此 可 见 ，PVS 方法 的 实质 是 : 假定 有 序 的 博弈 树 中 检查 最 左 路 径 是 最 优 的 ， 并 利 
用 这 条 路 径 上 的 值 形成 狭 窑 的 窗口 ， 搜 索 剩余 的 子 树 ， 以 试图 尽快 地 证 明 它们 是 低级 的 。 
车 一 棵 子 树 被 证 明 是 高 级 的 ， 则 必须 重新 搜索 以 确定 它 的 真正 值 ， 在 这 种 情况 下 ， 以 前 的 
许多 搜索 也 许 要 报废 ， 因 此 ，PVS 检查 的 结 点 数 也 可 能 比 p 搜索 还 多 ， 这 是 PVS 的 一 
点 风险 ,但 在 好 的 有 序 树 上 搜索 时 ， 由 于 确定 子 树 是 低级 所 节省 的 搜索 时 间 会 超过 识别 高 
级 子 树 后 做 无 用 搜索 的 代价 ，PVS 是 比较 有 效 的 . 


13.3.3 ”并 行 搜索 算法 


并 行 搜索 算法 通常 分 为 三 类 : BOD (Window Splitting) 或 并 行 吸出 (Parallel Aspi- 
ration) 算 法 ， 并 行 求 值 (Parallel Evaluation) RH iTi E £& A 88 B (Parallel Calculation of 
Node Function) 和 树 分 解 (Tree Decomposition) 算 法 。 

窗口 分 裂 是 将 初始 窗口 (~INF，TINF) 划 分 成 互 不 相交 的 区 间 分 给 各 个 处 理 器 ， 每 个 
处 理 器 以 分 给 它 的 区 间 为 初始 窗口 用 p 算法 搜索 同一 棵 博弈 树 ， 由 于 这 些 区 间 的 并 集 
复 盖 着 初始 窗口 (-INF，INF)， 最 后 总 有 一 个 处 理 器 搜索 到 真正 值 ， 例 如 ， 设 有 5 个 处 
LS, WASP RR (CINF, U-3e), (U-3e, Une), (U-s, Ute), (Ute U+t3e). 
{U+3e，INF)， 为 初始 窗口 去 搜索 博弈 树 。 使 用 这 种 并 行 搜索 方法 ， 当 处 理 器 数 大 较 小 
Bt, Hoi k= 2 或 3， 可 使 速度 倍数 超过 大， 但 是 ， 这 种 方法 所 能 达到 的 最 大 速度 倍数 局 
限 5~6， 并 和 使 用 多 少 处 理 器 无 关 太 1. 

对 终端 结 点 的 求 值 往往 是 很 费时 间 的 ， 这 是 因为 要 使 求 值 准确 ， 往 往 是 计算 求 值 函数 
的 工作 量 很 大 ， 并 行 求 值 算法 的 基本 思想 是 : 把 求 值 函数 设计 复杂 些 ， 分 成 许多 部 份 交 给 
不 同 的 处 理 器 并 行 计算 ， 最 后 把 计算 结果 综合 起 来 ， 这 样 可 提高 搜索 性 能 ;， 或者， 并行 计 


—265— 


算 各 个 结 点 的 求 值 尔 数 ， 自 底 向 上 的 比较 后 得 出 根 结 点 的 信 ， 这 样 可 以 使 搜索 加 深 . 

树 分 解 是 指 把 不 同 的 子 树 交 给 不 同 的 处 理 器 并 行 搜索 。 这 种 方法 引入 大 量 元 余 开销 ， 
主要 是 搜索 开销 和 通信 开销 ， 实 现 树 分 解 算法 通常 要 使 用 处 理 器 树 〈 即 处 理 器 按 树 状 连 
BO. ， 下 面 我 们 介绍 树 分 解 算法 的 几 种 实现 。 

1， 树 分 换算 法 (Tree-Splitting Algorithm)! 

这 个 算法 是 在 处 理 器 树 结构 上 实现 的 。 为 了 限制 处 理 器 问 通信 ， 应 当 使 用 简单 的 连接 
结构 ， 比 如 二 叉 树 结构 ， 结 点 代表 处 理 器 ， 边 代表 处 理 器 间 的 连接 。 在 最 简单 的 情形 ， 所 
有 非 终 端 结 点 处 理 器 执行 主 算 法 ， 一 旦 从 双亲 处 理 器 处 接收 一 个 位 置 和 (a,B) 窗 口 ， 则 生成 
后 继 者 位 置 ， 并 分 派 它们 给 孩子 处 理 器 去 并 行 搜索 .无 论 什 么 时 候 一 个 孩子 完成 ， 就 返回 
一 个 值 作为 它 的 子 树 的 值 ， 若 这 个 值 导 致 "界限 的 变化 ， 则 双亲 处 理 器 中 断 其 它 孩 子 的 搜 
索 ， 并 强迫 孩子 修改 a-p 值 。 修 改 算法 如 下 : 


算法 13.6 UPDATE 2-8 WINDOW ALGORITHM 
var alpha, beta: array[1..maxdepth] of integer; 
/ * alpha—beta bounds are stored in global tables * / 
procedure UPDATE (depth, side, bound: integer); 
begin 
if (side > 0) then aipha[depth}<-max(apha[depth].bound) 
else betafdepth]<-min(beta[depth].bound) 
endif; 
if (depth > 0) then UPDATE(depth—1,—side,—bound) endif 
end. 


MEA AOL ENE, ERARA- 算法 ， 使 得 构造 的 
博弈 树 达到 它 的 最 大 允许 深度 。 它 计算 树 的 终端 结 点 值 ， 并 返回 最 好 值 给 双亲 结 点 处 理 器 
作为 该 子 树 的 值 . 

树 分 裂 算法 形式 地 描述 如 下 : 


算法 13.7 TREE~SPLITTING ALGORITHM 
function TREESPLIT(p:position; alpha, beta: integer): integer; 
var width, i: integer; 
value: array{1..maxwidth] of integer; 
ÀJ: processor; 
begin 
if (i isa leaf processor) then return (ALPHA. BETA(palpha, bcta)) endif; 
width-GENERATE(p; / * RERA AI} width] + / 
for i-—1 to width pardo 
while (a child processor j is idle) do 
value[i]-—-;* TREESPLIT{ p{i],—beta,—alpha); 
begin / * 进入 临界 区 * / 
critical 
if (value[‘]> alpha) then alpha<—valuefi] endif 
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end; 
if (alpha > beta then terminate( ); return (alpha) endif / + £3247 + / 
endwhile 
endfor; 
return (alpha) 
end. 


算法 13.7 的 几 点 说 明 如 下 : 

(1) j* TREESPLIT 表示 在 第 /个 处 理 器 上 递归 执行 树 分 裂 算法 ; 

(2) for-pardo 并 行 执行 选 代 中 的 每 个 进程 ， 直 到 全 部 迭代 完成 时 只 有 一 个 进程 为 止 ; 

(3) while-do 表示 处 理 器 j SHIM MTA, 车 全 部 处 理 器 不 是 空闲 的 ， 则 处 于 
等 待 状态 ; 

(4) critical 表示 一 个 时 刻 仅 允许 一 个 进程 进入 到 临界 区 域 ; 

(5) terminate 表示 中 断 在 for 循环 中 仍 处 于 活动 状态 的 处 理 器 搜索 . 

并 行 实现 的 一 个 重要 特性 是 动态 的 修改 a- 
窗口 ， 这 是 它 加 快 孩子 处 理 器 完成 的 原因 。 即 使 
无 浪费 的 结构 ， 动 态 地 共享 这 些 边 界 亦 是 可 取 
的 。 但 是 ， 树 分 裂 算法 实现 中 ， 仍 然 花费 了 大 量 
时 间 做 无 用 功 .。 这 是 因为 此 算法 的 搜索 策略 比较 
死板 ， 等 同 地 对 待 搜索 树 中 的 各 个 结 点 ， 在 最 好 pul l 
或 较 好 的 移动 找到 前 ， 大 量 的 子 树 已 经 检查 过 ， 
而 在 串 符 实 现时 ， 许 多 子 树 是 可 以 修剪 的 A 
此 ， 搜 索 开销 被 大 景 引 人 ， 成 为 效率 损失 的 主要 
来 源 ， 幸 运 的 是 : 算法 13.6 所 示 的 修改 方法 相 P 
当 简单 图 13.14 进行 第 n+1 次 送 代 
2 主要 变量 分 裂 (Principal Variation Splitting) 盾 索 时 的 部 分 博弈 树 算法 

主要 变量 分 裂 简 记 作 PV- 分 裂 ， 亦 使 用 处 理 器 树 来 实现 ， 假 定 处 理 器 树 的 深度 小 于 
博 弯 树 的 深度 。 并 假定 搜索 博弈 树 中 的 一 个 结 点 的 所 有 移动 ， 是 按 从 左 到 右 的 顺序 排列 ， 
即 最 左 移 动 是 第 一 个 移动 ， 最 右 移动 是 最 后 一 个 移动 ， 排 列 的 顺序 按照 这 些 移动 的 求 值 大 
小 ， 从 大 到 小 排序 。 

PV- 分 裂 算法 的 实质 在 于 : 假定 最 左 路 径 是 最 好 的 移动 序列 ， 首 先 检查 这 条 路 径 ， 并 
用 检查 的 结果 构成 较 小 的 窗口 去 检查 其 它 的 移动 。 如 图 13.14 所 示 。 所 有 处 理 器 洛 最 左 路 
f Py-PQU PEE. HAGA P, E P, 的 孩子 分 给 个 处 理 器 并 行 搜索 ， 搜 索 结果 
返回 到 P,; 用 P, 搜索 结果 构成 的 小 窗口 交 给 各 个 处 理 器 ， 将 除 P, 外 的 所 有 P, 的 孩子 


分 给 这 些 处 理 器 并 行 搜索 ， 结 果 返 回 给 P。,，…， 一 直到 P 的 孩子 都 被 检查 并 返回 结果 
给 Pl 时， 搜索 则 完成 。 显 然 ， 这 个 搜索 算法 对 强 有 序 树 将 是 有 效 的 。 为 了 得 到 强 有 序 ， 
可 以 利用 迭代 深化 技术 。 


PV- 分 型 的 并 行 实现 形式 化 描述 如 下 : 
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算法 13.8 PARALLEL PV-SPLITTING ALGORITHM 


function PV__SPLIT(p: position; alpha, beta, length: integer) : integer; 
var width, i: integer; 
value: array [1..maxwidth] of integer; 
Jj : processor; 
begin ‘ 
if (length < 0) then return (TREESPLIT(p,alpha,beta)) endif; 

S * 处 理 器 树 的 终端 结 点 * / 
Width--GENERATE(g; | /* 生成 一 个 指针 指向 后 继 教 组 * / 
alpha«—PV-SPLIT(p,, —beta,—alpha, length-1); 
if (alpha> beta) then return(alpha) endif; 
for i<-2 to width pardo / FIRER» / 


while (a slave j isidle) do/ * 有 空闲 处 理 器 时 做 下 面 语 负 组， 否则 。 等 待 * / 


value|[i]*—— j .TREESPLIT(g[],- beta, —alpha); 
begin critical 
if (value[i]> alpha) then aipha--value[;] endif 


end; 


if (alpha> beta) then terminate( ); return(alpha) endif 


endwhile 
endfor; 
return(alpha) 
end. 


算法 的 说 明和 算法 13.7 一 样 。{15] 中 给 出 了 此 算法 的 理论 分 析 模 型 以 及 实际 博弈 程 
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图 13.45 5 个 诗 者 搜索 的 平均 开销 { 图 中 : TO 为 总 开销 ， 
SO 为 搜索 开销 ，CO= TO-SO) 


序 中 应 用 的 测试 结果 . 测试 结果 显示 ， 
PV- 分 裂 算 法 搜索 开销 很 小 ， 如 图 
13.15 所 示 ， 这 是 因为 它 沿 主 要 次 量 搜 
索 和 在 测试 实例 中 使 用 了 转换 表 、 排 斥 
RER. 另 方面 通信 开销 却 是 效率 损失 
的 主要 因素 ， 这 里 的 通信 开销 包括 检 
索 、 修 改 存 贮 表格 〈 指 转换 表 和 排斥 
表 ) 和 传送 信息 的 时 间 以 及 同步 开销 。 
所 谓 同 步 开销 是 指 为 了 等 待 别 的 处 理 器 
完成 搜索 而 空闲 的 时 间 开销 ， 在 PV- 
分 裂 算法 中 ， 同 步 开 销 又 占 主要 地 位 
因为 它 要 求 同 层 之 间 、 同 次 欠 代 之 间 进 
行 完整 的 信息 传递 ， 各 处 理 器 此 时 必须 
保持 同步 ， 所 以 导致 了 大 量 的 同步 开 


销 。 从 图 13.15 可 以 看 出 : 随 着 处 理 器 数目 的 增加 ， 搜 索 开销 平缓 地 增长 ， 而 通信 开销 却 


近似 地 成 指数 增长 。 
3. 异步 迭代 深化 
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异步 选 代 深化 并 行 ap 搜索 (Unsynchronized Tteratively Deepning Parallel 
Alpha-Beta Search， 简 记 为 UIDPABS) 是 一 个 比较 简单 的 树 分 解 算法 。 搜索 时 不 需要 通 
信 ， 也 不 需要 保持 各 处 理 器 间 的 同步 ， 因 而 控制 简单 .下 面 简单 地 描述 该 算法 的 工作 过 
程 ， 详 细 的 结果 参见 文献 9. 


算法 13.9 UIDPABS ALGORITHM 

(0 在 头 两 次 迭代 中 ， 所 有 处 理 器 执行 相同 的 搜索 ， 把 根 结 点 处 的 移动 排 次 序 ， 为 后 面 的 
搜索 做 好 准备 ， 因 为 全 部 处 理 器 的 排序 标准 都 相同 ， 所 以 它们 最 后 得 到 相同 的 移动 序列 ， 

O 确定 搜索 窗口 :每 个 窗口 对 应 一 个 变量 sore， 窗 口 力求 用 府 小 的 。 窗口 宽度 的 大 小 需 
参考 以 前 移动 的 score 计算 值 和 第 二 次 迭代 找到 的 score 值 ， 若 天 者 之 差 小 于 一 个 孩子 处 理 器 的 
计算 值 ， 则 置 窗口 为 (SR-PHl，SR+P-1) 否则 置 为 (SR-2P+1，SR+2P~1)。 其 中 :SR 为 根 处 
的 score 值 ，P 为 分 配给 孩子 处 理 器 计算 的 score 值 ， 

(3) 平均 分 配 各 处 理 器 在 根 处 的 移动 ， 若 有 天 个 处 理 器 ， 根 的 移动 有 M 个 ， 则 第 大 
个 处 理 器 的 移动 为 k，KtK，k+42K，…，k+L(M~k)/ K] + K, X, MPY E 
发 现 的 具有 高 值 的 score 移动 被 均匀 地 分 配给 各 个 处 理 器 . 

(4) 各 处 理 器 分 别 对 所 分 配 的 移动 做 迭代 深化 搜索 ， 即 迭代 深化 搜索 在 各 处 理 器 上 是 
异步 进行 的 。 

(5) 车 迭代 结束 时 处 理 器 计算 的 score 值 小 于 窗口 对 应 的 score A, WF -KIERA 
较 小 的 值 代替 窗口 的 score 值 ， 且 窗口 宽度 不 改变 。 然 而 ， 若 以 后 的 选 代 中 义 出 现 score 
值 小 于 窗口 的 ， 则 不 再 改变 窗口 的 score 值 ， 若 在 大 代 中 间 击 现 处 理 器 计算 的 score 值 大 
于 和 窗口 的 值 ， 则 选 代 立即 停止 ， 并 改变 痊 口 重新 开始 ， 比 如 车 用 窗口 {x， 力 使 迭代 中 途 停 
止 ， 则 用 窗口 (y，INF) 重 新 开始 迄 代 因此， 在 搜索 过 程 中 ， 处 理 器 并 不 是 都 在 搜索 同 
一 次 送 代 的 移动 ， 或 者 利用 相同 的 窗口 搜索 . 

(6) 当 到 达 某 个 事先 确定 的 时 间 限制 Ta 时 ， 则 搜索 终止 。 每 个 处 理 器 返回 它 的 主 
要 变量 和 score 值 给 主 处 理 器 ， 主 机 从 中 瑞 定 最 好 的 并 将 其 决定 通知 其 它 处 理 器 . 若 一 个 
处 理 名 正在 搜索 先前 的 移动 子 集 而 没有 本 次 从 代 的 主要 变量 和 score 值 ， 同 时 收 到 主机 的 
搜索 终止 命令 时 ， 则 将 倒数 第 二 次 适 代 中 找到 的 主要 变量 和 score 传送 给 主机 .如 果 主 机 
自己 找到 最 好 的 移动 ， 即 主机 有 一 个 score 值 在 上 、 下 界 内 ， 那 么 搜索 完成 ， 此 时 主机 将 
计算 的 score 值 记 人 窗口 和 发 送 给 别 的 处 理 器 ， 如 果 全 部 处 理 器 计算 的 score 值 都 小 于 各 
自 窗口 的 对 应 值 ， 那 么 整个 搜索 必须 用 更 宽 的 窗口 重新 进行 


UIDPABS 的 突出 特点 是 异步 进行 搜索 ， 而 且 算 法 控制 简单 .但 是 宛 余 搜索 增多 ， 搜 
索 开销 增 大 ， 因 而 导致 性 能 下 降 ， 和 PV-- 分 裂 算法 相 比 ， 在 8 个 处 理 器 的 情形 ，PV~ 分 
RHE UIDPABS 更 为 有 效 ， 大 约 是 高 30% , 


13.4 小 结 


本 章 主 要 讨论 用 状态 空间 树 表示 的 组 合 搜索 问题 的 并 行 算法 ， 对 “与 树 "的 搜索 ， 我 们 
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介绍 了 基于 分 治 策略 设计 的 并 行 算法 ， 由 于 传播 开销 和 组 合 开销 ， 并 行 分 治 算法 的 速度 倍 
数 受 到 了 限制 。 并 行 计算 的 效率 和 并 行 的 粒度 有 很 大 关系 、 

对 于 “或 树 "的 搜索 ， 这 里 叙述 了 分 枝 限 界 方法 ， 在 最 小 代价 (或 叫 最 好 优先 ) 分 枝 限 
界 算法 中 ， 每 一 步 选 择 最 小 代价 的 结 点 进行 扩展 ， 求 解 过 程 中 搜索 的 结 点 数目 最 少 。 表征 
分 村 限界 算 法 的 四 个 要 素 ( 即 分 枝 规则 、 选 择 规则 、 消 去 规则 和 终止 条 件 ) 都 可 以 并 行 实 
现 ， 对 求解 旅行 商 问题 ， 这 里 介绍 了 Mohan 的 两 种 并 行 化 处 理 ， 即 使 用 要 素 中 的 前 两 条 
规则 ， 并 行 分 解 问题 为 更 小 的 子 问题 和 并 行 安排 搜索 次 序 ， 并 行 分 枝 限 界 算法 的 主要 问题 
是 如 何 保持 处 理 器 的 高 效率 ， 合 理 地 结合 并 行 和 选择 结 点 的 执行 次 序 ， 并 行 算法 可 望 达到 
好 的 效率 . 然而，Lai 和 Sati ASE: 并 行 分 枝 限 界 算法 存在 着 异常 现象 ， 且 在 解 
07 1 背包 问题 中 业 己 出现 。 尽 管 如 此 ， 分 枝 限界 的 并 行 化 仍然 经 常 被 使 用 ， 而 且 在 大 多 
数 实 践 中 很 少 出 现 异 常情 况 ， 

博弈 树 是 “与 / 或 树 " 的 很 好 例子 。 对 与 / 或 树 的 搜索 经 常 使 用 BER CZN 
上 、 下 界 和 自 底 向 上 计算 得 出 的 启发 函数 值 比较 ， 剪 去 超出 界限 的 结 点 。 它 本 身 就 是 一 个 
有 效 的 方法 。 本 章 13.3 节 除了 介绍 Knuth 和 Moore 的 a-p 搜索 算法 外 ， 还 叙述 了 吸出 
搜索 ， 转 换 表 、 送 代 深 化 、 主 要 变量 搜索 等 改进 技术 ， 这 些 改 进 方法 是 并 行 化 可 依照 的 . 
关于 p 搜索 的 并 行 化 ， 这 里 着 重 介绍 了 树 分 解 算法 ， 包 括 树 分 裂 算 法 、PV- 分 裂 算法 
和 异步 迭代 深化 算法 UIDPABS. 应 当 指出 ; 在 多 处 理 机 上 的 并 行 a-8 BUR. BMT 
外 的 开销 ， 即 是 搜索 开销 和 通信 开销 、 树 分 裂 算法 和 UIDPABS 算法 的 搜索 开销 是 主要 
的 损失 效率 的 来 源 ，PV- 分 裂 算法 主要 是 通信 开销 影响 效率 的 提高 。 

关于 组 合 搜索 问题 ， 我 国 计 算 机 科学 家 李 国 杰 研究 员 进 行 了 系统 全 而 的 研究 ， 他 和 他 
的 同事 发 表 了 一 系列 的 有 关 论文 ， 在 并 行 处 理 领域 影响 较 大 ， 读 者 若 能 阅读 他 们 的 论文 ， 
对 组 合 搜索 问题 的 并 行 算法 ， 将 会 有 更 全 面 的 理解 

基于 分 治 策略 设计 的 并 行 算法 ， 本 书 前 而 的 章节 已 经 涉及 。Horowitz and Zorat yt 
论 了 和 矩阵 乘法 和 排序 算法 ， 在 他 们 建议 的 模型 上 达到 了 最 优 的 复杂 性 ，Das and Deo Pte 
SIMD-EREW PARM 模型 上 ， 应 用 分 治 策略 建议 了 求 无 向 图 连通 分 支 和 最 小 生成 森林 
的 并 行 算法 ， 又 使 用 它们 设计 了 求 图 的 基本 回路 集 、 桥 以 及 检测 二 分 图 的 并 行 算法 ， 无 论 
是 对 稠密 图 还 是 对 稀 朴 图 ， 所 有 这 些 算 法 都 是 最 优 的 . 

关于 最 小 代价 分 枝 限 界 并 行 算法 的 效率 分 析 。 对 于 共享 存储 模型 ， 李 国术 及 其 同事 推 
SHERRAN: 
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其 中 : 
Ti(5) 是 单个 处 理 器 执行 搜索 所 需 的 时 间 ; 

Tb) 是 大 个 处 理 器 执行 搜索 所 需 的 时 间 ; 

”是 处 理 器 个 数 ; 

h 是 状态 空间 树 的 高 度 。 
并 且 指 出 ， 当 下 界 函 数 有 中 等 精度 时 ， 最 小 代价 搜索 得 出 好 的 性 能 。Quinn"3 在 超 立 方 体 
结构 计算 机 上 实现 了 并 行 分 枝 限 界 算法 .Wah 等 人 在 一 种 特别 设计 的 计算 机 上 实现 了 最 
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好 优先 的 分 枝 限 界 算法 ， 并 描述 了 动态 规划 的 并 行 化 和 并 行 解 还 辑 程序 设计 问题 ，Yu 等 
人 中 使 用 好 的 存 贮 管 理 系统 ， 以 便 支 持 大 型 存 贮 空 间 的 需要 ， 在 二 级 存 贮 系统 上 有 效 地 
实现 了 并 行 分 枝 限界 算法 . 

并 行 搜索 与 / 或 树 的 文献 较 多 ， 不 同 的 并 行 算法 为 了 达到 各 自 的 目标 ， 采 用 不 同 的 策 
路 得 出 相应 的 结果 ， 和 企 是 ， 并 行 -8 搜索 算法 的 速度 倍数 ， 在 实践 中 究竟 能 达到 多 少 ， 
仍然 是 一 个 尚 需 研究 的 问题 ， 对 博 蛮 树 的 并 行 搜索 ，Marsland & Campbelln2 已 发 表 了 可 
读 性 好 的 综述 论文 ， 建 议 读者 阅读 . 

关于 某 些 与 / 或 树 的 启发 性 搜索 ， 李 国 杰 等 人 对 组 合 判定 问题 的 研究 后 提出 : 决定 下 
一 步 做 什么 取决 于 两 方面 因素 ， 即 每 个 分 枝 的 成 功 概率 P 及 搜索 每 一 子 树 的 成 本 C 《时 
间 )， 对 于 一 组 具有 “或 关系 "的 结 点 应 选用 启发 画 数 了/C 最 大 的 结 点 先 做 ; 对 于 一 组 具 
有 “与 关系 "的 结 点 应 选择 (1-P)/ C 最 大 的 结 点 先 做 ， 文 中 还 建议 了 一 种 最 优 的 搜索 方 
案 ， 将 “解答 树 " 按 成 功率 排序 ， 依 次 地 搜索 各 裸 解答 树 。 然而， 在 实际 搜索 中 ， 面 对 大 量 
的 结 点 存在 面 每 个 结 点 的 成 功 概率 都 较 小 时 ， 如 何 正确 使 用 “或 并 行 "和 “与 并 行 "?， 仍 然 是 
一 个 悬 面 未 决 的 问题 . 

许多 人 工 智能 问题 都 可 归结 为 在 一 个 巨大 的 可 能 解 的 搜索 空间 中 寻找 一 个 或 若干 个 满 
意 解 ， 探 试 搜索 @ 与 并 行 处 理 技术 是 提高 智能 机 效率 的 基本 途径 ， 由 于 探 试 搜索 算法 在 许 
多 方面 不 同 于 通常 的 确定 型 算法 ， 将 并 行 技术 与 探 试 搜索 结合 起 来 必然 遇 到 许多 新 间 题 。 
对 这 些 问题 的 深信 研究 将 为 研制 智能 计算 机 提供 必要 的 理论 基础 ， 址 少 设计 的 盲目 性 .下 
面 我 们 扼要 地 列 出 几 个 有 关 并 行 组 合 搜索 的 重要 研究 课题 P3 
L 如何 表示 与 评价 启发 知识 

指导 搜索 的 启发 知识 实际 上 是 一 种 控制 元 知识 ， 即 关于 如 何 运用 问题 领域 知识 的 知识 
和 关于 问题 求解 方法 的 知识 。 在 计算 机 内 如 何 篇 洁 有 效 地 表示 这 些 知识 是 至 今 尚 未 解决 的 
问题 。 搜索 效率 在 很 大 程度 上 决定 于 问题 表示 的 方法 。 问 题 表示 方法 又 与 知识 表达 方式 有 
关 ， 所 以 研究 搜索 必须 与 研究 知识 表达 相 结合 。 在 申 行 条 件 下 如 何 比较 两 个 启发 函数 也 有 
一 些 成 果 ， 但 这 些 结论 一 般 不 能 直接 用 于 并 行 搜索 ， 我 们 需要 建立 一 亦 在 并 行 环境 下 如 何 
评价 启发 函数 的 理论 。 
2. 通过 机 器 自学 习 积累 完善 启发 知识 

启发 知识 是 不 精确 和 不 完全 的 ， 积 累 与 完善 启发 知识 的 重要 途径 是 机 器 自学 习 ， 而 机 
器 学 习 本 身 也 常常 采用 归纳 搜索 的 办 法 ， 从 事例 中 归纳 出 有 用 的 启发 知识 ， 这 些 启发 知识 
不 仅 可 用 于 指导 搜索 路 径 的 选择 ， 而 且 可 用 于 建立 优势 关系 ， 提 高 淘 梁 率 。 一 个 智能 应 用 
程序 一 开始 可 采用 盲目 搜索 ， 通 过 运行 通 渐 积累 启发 信息 和 知识 ， 提 高 智能 程度 .事实 
上 ， 目 前 研制 的 神经 网 计算 机 都 包含 了 机 器 学 习 功 能 。 有 些 是 学 习 输 入 与 输出 之 闻 的 关联 
性 ; 有 的 学 习 识别 输 和 信息 中 有 意义 的 模式 ， 这 些 已 采用 的 学 习 机 制 的 速度 一 般 都 很 慢 ， 
而 且 学 习 的 速度 取决 于 不 能 自动 改变 的 神经 网 的 结构 。 研 究 快速 有 效 的 机 器 学 习 方 法 是 提 
高 并 行 搜索 性 能 的 关键 . 
3， 并 行 搜索 的 性 能 予 测 


全 最 好 优先 搜索 和 f 搜索 都 属于 探 域 搜索 . 
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为 了 取得 接近 线性 的 加 速 ， 在 设计 一 个 并 行 智能 机 之 前 ， 必 须 予 测 并 行 搜索 的 性 能 。 
目前 对 组 合 判 定 问题 的 并 行 搜索 常 采用 计算 机 模拟 的 方法 估计 性 能 ， 由 于 在 模拟 机 上 运行 
的 问题 规模 很 小 ， 这 种 小 问题 的 模拟 很 蕉 反映 并 行 搜索 的 真实 性 能 ， 因 为 随 着 问题 规模 增 
大 ， 组 合 搜索 问题 的 并 行 性 一 般 会 明显 增加 。 模 拟 实验 需要 与 理论 分 析 相 结 合 。 在 模拟 与 
分 析 时 都 应 特别 注意 通信 对 性 能 的 影响 . 

4. 并 行 粒度 的 选择 

并 行 粒度 与 系统 提供 的 通信 和 能力 有 关 ， 但 更 主要 的 是 取决 于 求解 的 问题 本 身 .. 建立 一 
套 系 统 的 方法 分 析 智能 问题 固有 的 并 行 性 十 分 几 要 。 在 分 析 并 行 性 时 需要 考虑 启发 知识 ， 
避免 盲目 的 并 行 和 盲目 的 搜索 . 

5. 确定 并 行 选择 的 策略 

选择 启发 函数 值 最 好 的 子 问题 先 做 并 不 是 必须 遵从 的 原则 .在 并 行 条 件 下 ， 由 于 全 局 
性 的 选择 开销 很 大 ， 严 格 的 最 好 优先 在 很 多 场合 不 适用 .我 们 面临 的 一 个 重要 课题 是 如 何 
按 选 择 对 性 能 的 影响 程度 区 分 各 类 问题 ， 从 而 系统 地 确定 合适 的 选择 策略 
6. 并 行 的 淘汰 策略 

习惯 于 确定 型 算法 的 学 者 往往 忽视 淘汰 在 并 行 搜索 中 的 作用 。 实 际 上 选取 好 的 淘汰 策 
略 可 以 大 大 降低 计算 复杂 性。 对 于 组 合 判定 问题 怎样 确定 淘汰 原则 至 今 还 是 未 解决 的 问 
题 .实现 淘 汰 必然 需要 通信 ， 在 确定 淘汰 策略 时 既 要 考虑 通信 开销 又 要 考虑 通信 带 来 的 好 
处 .我 们 应 研究 这 两 者 之 间 的 折衷 原则 , 

7 并 行 搜索 与 新 技术 的 结合 

近年 来 光学 全 息 技术 开始 用 于 解决 人 工 智能 的 某 些 应 用 问题 。 全 息 技术 也 可 看 成 是 一 
种 形式 的 搜索 。 如 何 将 并 行 搜索 技术 与 光学 全 息 技术 结合 起 来 是 研制 光学 智能 计算 机 必须 
考虑 的 问题 。 
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第 十 四 章 ”神经 网 络 
在 图 论 问题 中 的 应 用 


进入 八 十 年 代 以 来 ， 研 究 以 非 线 性 大 规模 并 行 分 布 式 处 理 为 主流 的 神经 网 络 ， 取 得 
了 引信 注 目的 进展 。 神 经 网 络 的 应 用 已 经 滩 透 到 各 个 领域 ， 并 在 智能 控制 、 模 式 识 
别 、 计 算 机 视觉 、， 自 适应 滤波 和 信号 处 理 、 非 线性 优化 、 自 动 目 标识 别 、 连 续 语音 识 
别 、 声 纳 信和 号 的 处 理 、 知 识 处 理 、 传 感 技术 与 机 器 人 、 生 物 医学 工程 等 方面 取得 了 令 人 
鼓舞 的 成 就 。 对 神经 网 络 的 研究 ， 除 了 脑 神经 科学 家 外 ， 计 算 机 科学 、 控 制 论 、 信 息 科 
学 、 微 电子 学 、 心 理学 、 认 知 科学 、 物 理学 和 数学 等 学 科 的 科学 家 以 及 各 国 的 企业 家 也 
激 起 了 巨大 热情 和 广泛 兴趣 。 人 们 普遍 认为 : 它 将 使 电子 科学 、 信 息 科学 等 领域 产生 革 
命 性 变革 ， 并 将 促使 以 神经 计算 机 为 基础 的 高 技术 群 的 诞生 和 发 展 . 


14.1 概 述 


神经 网 络 是 一 门 多 学 科 、 综 合 狂 的 研究 领域 ， 引 起 了 各 界 专家 的 普遍 关注 。 神 经 网 

络 的 具体 形态 各 异 、 且 还 在 发 展 中 ， 但 可 概括 地 定义 为 : 由 大 量 简单 元 件 (神经 元 ， 可 用 
电子 元 件 、 光 学 元 件 等 模拟 ) 广泛 相互 连接 而 成 的 复杂 网 络 系统 ， 它 是 在 现代 神经 科学 研 
究 成 果 的 基础 上 提出 的 ， 反 应 了 人 脑 功 能 的 若干 基本 特征 ， 但 并 非 神经 系统 的 真实 写照 
而 只是 其 简化 、 抽 象 和 模拟 ， 即 人 工 神经 网 络 是 一 种 抽象 的 数学 模型 ， 从 不 同 的 研究 角度 
和 目标 出 发 ， 它 可 用 作 计 算 模 型 ， 或 大 脑 结构 模型 、 或 认 知 模型 。 本 章 将 它 作为 计算 模型 
来 使 用 . 

研究 这 一 系统 的 根本 目的 在 于 探索 人 脑 加 工 、 贮 存 和 搜索 信息 的 机 能 ， 进 而 探索 将 此 
原理 应 用 到 各 种 人 工 智能 的 可 能 性 . 这 也 正 是 此 研究 具有 生命 力 的 根本 原因 


14.1.1 生物 神经 元 模型 


神经 网 络 的 基本 形态 来 源 于 大 脑 皮层 结构 神经 科学 研究 表明 ， 大 脑 皮 层 由 大 量 ( 
107 ~ 10” 个 ) 神经 元 组 成 ， 昌 然 可 以 划分 成 多 种 类 型 的 神经 元 ， 但 它们 的 基本 结构 是 
相似 的 ， 每 个 细胞 体 有 大 量 树 突 (Dendrite， 即 输入 端 ) 和 轴 突 (Axon 即 输出 端 . 一 
个 神经 元 的 轴 突 与 另 一 个 神经 元 的 树 突 的 结合 部 称 为 突 触 (Synapse), ERE T HERZ 
间 的 连接 强度 和 人 性质 OCS) ， 即 是 决定 神经 元 之 闻 相 互 作用 的 强 妮 和 正 负 ， 每 一 
个 神经 元 可 以 有 10! ~ 10 个 突 触 ， 这 就 表明 大 脑 皮层 是 一 个 广泛 连接 的 复杂 网 络 系统 
生物 控制 论 告诉 我 们 : 神经 元 作为 控制 和 信息 处 理 的 基本 单元 ， 具 有 某 些 重要 的 功能 
和 特性 。 比 如 : 具有 时 空 整合 的 输入 信息 处 理 功能 ; 具有 兴奋 和 抑制 两 种 常规 工作 状态 ; 
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罕 触 界面 具有 脉冲 / 电位 信号 转换 功能 ;神经 纤维 传导 速度 有 快 有 慢 ; 具有 突 触 延 时 和 
不 应 期 ， 具 有 学 习 功 能 、 遗 忘 或 疲劳 功能 (饱和 效应 ) . 

随 着 脑 科 学 和 生物 控制 论 研 究 的 进展 ， 人 们 对 神经 元 的 结构 和 功能 有 了 进一步 的 了 
解 ， 神 经 元 并 不 是 一 个 简单 的 双 稳 态 逻 辑 元 件 ， 而 是 超级 的 微型 生物 信息 处 理 机 . 


14.1.2 神经 网 络 的 基本 特征 

神经 网 络 是 由 大 量 处 理 元 件 互 连 而 成 的 网络 的 信息 处 理由 神经 元 之 闻 约 相互 作用 
来 实现 ; 知识 与 信息 的 存 贮 表现 为 网 络 元 件 互 连 间 分 布 式 的 物理 联系 上 ; 网 络 的 学 习 和 识 
划 决 定 于 各 神经 元 连接 权 的 动态 演化 过 程 。 神 经 网 计算 机 就 是 试图 模拟 这 一 信息 处 理 机 制 
的 一 种 新 型 计算 机 模型 ， 其 核心 由 类 似 于 人 脑 神经 元 的 简单 处 理 器 组 成 ， 而 处 理 器 之 问 的 
联结 则 与 神经 元 之 间 的 突 触 联系 相似 。 
1。 神经 元 的 形式 化 拱 述 

神经 元 是 神经 网 络 的 基本 处 理 单元 ， 它 
一 般 是 一 个 多 输入 / 单 输出 的 非 线性 器 件 ， 
其 结构 模型 如 图 14.1 所 示 。 其 中 : a, RH 
经 元 的 内 部 状态 ，9, MME, x, 为 输入 信 
Sw BRM 4 到 连接 的 权 值 ，s; 表示 
外 部 输入 信号 〈 在 某 些 情况 下 ， 它 订 以 控制 
神经 元 % ， 使 得 它 保持 在 某 一 状态 }。 这 种 
结构 模型 可 形式 地 描述 为 : 图 14.1 — 神经 元 结构 模型 


o= Xv, x, t5,—0, 

u, = flo) 

y, 7 R(u) — h(a h=g-f 

当 神 经 元 没有 内 部 状态 时 ， 可 以 令 f=1 GES) ， 如 图 142 所 示 。 常 用 的 神经 
元 非 线性 特性 可 描述 如 下 : 

(1) AAA: 在 这 种 模型 中 ， 神 经 元 没有 内 部 状态 ， 而 且 函 数 /是 一 个 阶 跃 函 
数 ，《 见 图 14.2)(a)) ， 即 : 

A(x) f(x) u(x,) 


x, >0 


1, 

fea-l, x, <0 
这 是 最 早 提出 的 二 值 离散 神经 元 模型 ; 

D 分 段 线性 型 ， 如 图 14.2(b) 所 示 ; 

O SR: 它 一 般 是 没有 内 部 状态 并 且 连 续 取 值 ， 其 I/ O 特性 常用 对 数 或 双 曲 正切 
等 一 类 5 曲线 来 表示 ， 如 xi = 17{1+ expl R x, = [+ tanho, / x,)] /2 等 ， 这 类 
曲线 反映 了 神经 元 的 饱和 特性 . 

2. 神经 网 络 模型 
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按照 人 工 神经 网 络 对 生物 神经 系统 的 不 同 组 织 层次 和 抽象 层次 的 模拟 ， 神 经 网 络 模 
型 可 分 为 下 列 五 类 

(D 神经 元 层次 模型 ;主要 研究 单个 神经 元 的 动态 特性 和 自 适应 性 ， 探 索 神经 元 对 
输入 信息 有 选择 的 响应 和 某 些 基本 存 贮 功能 的 机 理 ; 

(2) ”组 合式 模型 : 它 由 数 种 相互 补充 、 相 互 协作 的 神经 元 组 成 ， 用 于 完成 某 些 特定 
的 任务 ， 如 模式 识别 ， 机 器 人 控制 等 

(3) ”网 络 层次 模型 : 它 是 由 许多 相同 神经 元 连接 组 成 的 网 络 ， 从 整体 上 研究 网 络 的 
集体 特性 ， 如 Hopfield 神经 网 络 中 ; 

(4) ”神经 系统 层次 模型 :一 般 由 多 个 不 同性 质 的 神经 网 络 构成 ， 以 模拟 生物 神经 的 
更 复杂 更 抽象 的 性 质 ， 如 自动 识别 、 概 念 形成 、 全 局 稳定 控制 等 ; 

(5) ”智能 型 模型 ;这 是 最 抽象 的 层次 模型 ， 大 多 数 以 语言 形式 模拟 人 脑 信息 处 理 的 
运行 、 过 程 、 算 法 和 策略 。 这 类 模型 试图 模拟 诸如 感知 、 思 维 、 问 题 求解 等 基本 过 程 
而 且 和 人 工 智能 紧密 相关 


DUE 
f(a) 


" L4 


(a) 二 值 离散 型 fb) 分 段 线性 型 (©) Sigmoid 型 
图 14.2 神经 元 的 I/ D 特性 


神经 网 络 模 者 很 多 ， 而 且 现 有 模型 远 远 不 是 完备 和 成 熟 的 ， 有 待 进一步 发 展 .总体 
来 说 ， 它 应 力图 体现 人 脑 的 基本 特征 。 因 而 神经 网 络 具有 以 下 的 基本 特征 

D 以 大 规模 模拟 并 行 处 理 为 主 ， 这 里 的 并 行 处 理 决 不 是 简单 的 “以 空间 的 复杂 性 代 
替 时 间 复 杂 人 性 ”， 而 是 反映 了 不 同 的 “计算 ”原理 ， 因 此 ， 不 能 将 神经 网 络 的 大 规模 并 
行 处 理 与 多 处 理 器 的 并 行 机 等 同 起 来 . 单纯 的 并 行 机 制 不 能 很 好 地 体现 因果 关系 和 信息 
的 相互 影响 ， 功 能 必然 过 于 简单 ， 好 的 网 络 应 是 大 规模 并 行 处 理 和 串 行 处 理 的 有 机 结 
&. 关于 模拟 计算 ， 历 史上 曾 因 它 的 计算 精度 太 低 而 被 数值 计算 所 代替 ， 神 经 网 络 则 不 
同 . 它 控 长 的 并 不 是 精密 的 数值 计算 或 绝对 准确 的 决策 ， 只 是 要 求 基本 正确 。 正 如 人 不 
可 能 绝对 正确 一 样 ， 神 经 网 络 主要 涉及 腿 次 “运算 ”， 而 且 它 本 身 具 有 容错 性 和 纠 错 
性 ， 误 差 不 会 积累 ， 高 精度 实际 上 并 无 必要 。 在 这 里 ， 模 氢 计算 对 减少 计算 工作 量 起 到 
了 重要 的 作用 。 

@@ 具 有 很 强 的 和 鲁 棒 性 和 容错 仁 ， 善 于 联想 、 概 括 、 类 比 和 推广 。 由 于 信息 存 贮 本 质 上 
是 分 布 式 的 ， 任 何 包 部 的 损伤 不 会 影响 整体 的 结果 ， 

加 具有 很 强 的 自学 习 能 力 、 系统 可 以 在 学 习 过 程 中 不 断 完善 自己 ， 具 有 创新 特 
点 ， 这 不 同 于 人 工 智 能 中 的 专家 系统 ， 后 者 只 是 专家 经 验 的 知识 库 ， 并 不 能 创新 和 
AH. 

@ 它 是 一 个 具有 高 度 非 线性 的 超大 规模 连续 堵 间 动力 系统 ， 具 有 集体 运算 的 能 
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不 同 。 

3. 挤 经 网 络 的 信息 处 理 能 力 

神经 网 络 的 信息 处 理 能 力 包括 :中 网 络 的 信息 存 贮 能 力 ; 名 网 络 的 计算 能 力 。 它 们 对 应 
下 面 的 问题 

(i) 在 一 个 含 N 个 神经 元 的 神经 网 络 中 ， 可 存 贮 多 少 信息 ? 

后 神经 网 络 具有 什么 样 的 计算 能 力 ， 即 它 能 够 有 效 地 计算 哪些 问题 ? 

存 贮 能 力 与 计算 能 力 是 现代 计算 机 科学 的 两 个 基本 问题 ， 在 人 工 神经 网 络 中 ， 它 们 同 
样 构成 了 神经 网 络 理论 的 两 个 最 基本 的 问题 . 

在 传统 的 数字 计算 机 中 ， 计 算 与 存 贮 是 完全 独立 的 两 个 部 分 ， 即 计算 机 在 计算 前 先 要 
从 存 贮 器 中 取出 待 处 理 的 数据 ， 然 后 再 进行 计算 ， 最 后 又 将 计算 结果 放 人 存 贮 器 中 .这 
样 ， 存 贮 风 与 运算 器 之 间 的 通道 就 形成 了 现代 计算 机 的 瓶 恬 ， 从 而 大 大 限制 了 计算 机 的 计 
FEH. 

在 人 工 神经 网 络 系统 中 ， 信 息 的 存 贮 与 处 理 〈 计 算 ) 其 合 为 一 体 的 ， 即 信息 的 存 贮 体 
现在 神经 元 互 连 的 分 布 上 ， 并 以 大 规模 并 行 分 布 方式 处 理 。 从 系统 论 的 观点 看 ， 可 以 把 神 
经 网 络 看 成 是 由 大 量子 系统 组 成 的 大 系统 ， 系 统 的 最 终 行 为 完全 由 它 的 吸引 子 决 定 ， 如 果 
将 动力 系统 的 吸引 于 视 作 记忆 的 话 ， 那 么 从 初 态 向 吸引 子 的 流动 过 程 就 是 寻找 记忆 的 过 
程 。 初 态 可 以 看 作 是 给 定 有 记忆 的 部 分 信息 、 换 名 话说 ， 流 动 的 过 程 就 是 从 部 分 信息 找 出 
全 部 信息 的 过 程 ， 这 就 是 联想 记忆 的 基本 原理 . 进一步 说 ， 车 把 动力 系统 的 稳定 吸引 子 看 
成 为 系统 计算 能 量 讽 数 的 极 小 点 ， 则 系统 最 终 会 流向 期 望 的 最 小 点 , “计算 "也 就 在 运动 过 
程 中 悄悄 地 完成 了 ， 运 动 的 时 间 就 是 计算 的 时 间 ， 这 就 是 神经 网 络 计算 机 的 基本 原理 ， 即 
利用 吸引 子 进行 存 贮 和 计算 . 

从 广义 角度 讲 ， 微 积分 ， 文 字 翻 译 、 推 理 等 都 是 一 个 计算 过 程 。 而 从 数学 观点 看 ， 计 
算 就 是 在 满足 一 定 公理 、 定 理 的 条 件 下 ， 从 一 空间 到 另 一 空间 的 代数 映射 ， 从 物理 观点 
看 ， 计 算是 按照 一 定 的 自然 规则 ， 在 某 种 “硬件 "上 所 发 生 的 一 些 物 理 规则 。 因 此 ， 计 算 可 
以 表示 为 一 动力 系统 中 的 状态 空间 变换 的 轨迹 。 神经 网 络 的 计算 就 是 其 中 状态 的 转换 ， 其 
计算 过 程 可 看 成 是 状态 的 转换 过 程 ， 对 给 定 的 输入 ， 它 的 计算 结果 是 系统 的 稳定 状态 . 

目前 已 开发 的 30 多 种 神经 网 络 模型 都 是 针对 某 种 特殊 用 途 的 ， 因 而 对 这 些 特殊 问题 
有 很 强 的 计算 能 力 。 如 何在 具体 模型 中 更 好 地 体现 神经 网 络 的 特征 ， 仍 有 大 量 的 工作 要 
th. 而且， 传统 的 途径 在 许多 问题 上 还 是 很 有 效 的 。 现 在 ， 人 们 继续 努力 寻找 新 的 机 制 ， 
以 构造 通用 的 神经 网 络 模型 , 

迄今 为 止 ， 人 们 发 现 神经 网 络 可 以 完成 的 信息 处 理 任务 有 : 数学 逼近 映射 ; 概率 密度 
函数 的 估计 ; 从 二 进 制 数据 基 中 提取 相关 的 知识 ; 形成 拓扑 连续 及 统计 意义 上 的 问 构 映 
射 ; 最 近 相 邻 模式 分 类 ;数据 聚集 ;最 优化 问题 的 计算 等 . 

4. 神经 网 络 的 互 连 结构 形态 

根据 连接 方式 的 不 同 ， 神 经 网 络 可 分 成 以 于 几 种 类 型 

(D 无 反馈 的 前 向 网 络 。 如 图 14.3(a) 所 示 ， 神 经 元 分 层 排列 ， 组 成 输入 层 、 隐 层 
(中 间 层 ) 和 输出 层 . 每 一 层 的 神经 元 只 接受 前 一 层 神经 元 的 输入 。 输 人 模式 经 过 各 
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层 的 顺 次 变换 后 ， 得 到 输出 层 的 输出 5 

D 有 反馈 的 前 向 网 络 。 如 图 14.3(b) 所 示 ， 从 
输出 层 到 输入 层 含有 反馈 。 

{3) 层 内 有 相互 结合 的 前 向 网 络 。 如 图 143c) 
所 示 ， 通 过 层 内 神经 元 间 的 相互 结合 ， 可 以 实现 同一 
层 内 神经 元 之 间 的 横向 抑制 或 兴奋 机 制 ， 这 样 可 以 限 
制 每 层 内 能 同时 动作 的 神经 元 数目 ， 或 者 把 每 层 内 的 
神经 元 分 为 着 二 组 ， 让 每 组 作为 一 个 整体 来 动作 . 

4) 相互 结合 型 网 络 ， 如 图 14.3({d) 所 示 ， 这 种 
网 络 在 任意 两 个 神经 元 之 间 都 可 能 有 连接 。 在 无 反馈 
的 前 向 网 络 中 ， 信 号 一 旦 通过 某 个 神经 元 ， 过 程 就 结 
RT: 而 在 相互 结合 网 络 中 ， 信 和 号 要 在 神经 元 之 间 反 
复 往返 传递 ， 网 络 处 在 一 种 不 断 改变 状态 的 动态 过 程 
中 、 从 某 一 初 态 开 始 ， 经 过 若干 次 的 变化 ， 才 会 到 达 
某 种 平衡 状态 ， 根 据 网 络 的 结构 和 神经 元 的 特性 ， 还 
有 可 能 进入 周期 振荡 或 其 它 如 浑 沸 等 平衡 状态 


{D、(2)、(3) 可 看 作 是 (4) 的 一 种 特殊 情况 ， 但 不 
论 从 网 络 的 计算 和 学 习 机 制 看 ， 还 是 从 它们 的 应 用 场 
合 看 ， 都 有 很 大 的 区 别 ， 
5. 神经 网 络 的 工作 方式 
c 神经 网 络 的 工作 过 程 主要 由 两 个 阶段 组 成 .一 个 
阶段 是 工作 期 ， 此 时 各 连接 权 值 固定 ， 计 算 单元 的 状 
态 逐 渐 演化 ， 以 求 达到 稳定 状态 。 另 一 阶段 是 学 习 其 
( 自 适应 期 ， 或 设计 期 )， 此 时 各 计算 单元 状态 不 变 ， 
( 各 连接 权 值 可 以 修改 〈 通 过 学 习 样 本 或 其 它 方法 ) 。 
前 一 阶段 较 快 ， 各 单元 的 状态 亦 称 短期 记忆 ， 后 一 阶 
段 慢 得 多 ， 权 及 连接 方式 亦 称 长 期 记忆 - 
能 量 函 数 是 神经 网 络 的 一 个 基本 盘 ， 按 对 能 量 隐 
图 14.3 网 络 结构 的 各 种 形态 数 的 利用 可 分 为 三 种 工作 方式 : 
(1) 能量 函数 的 所 有 局 部 极 小 点 都 起 作用 .这 一 类 主要 用 于 各 种 联想 存 贮 器 ， 信 息 压 
缩 及 编码 . d 
Q) 只 利用 能 量 函数 的 全 局 最 小 点 。 这 一 类 主要 用 于 求解 组 合 最 优化 问题 。 
{3) 在 工作 中 不 考虑 能 量 函 数 ， 主 要 作用 是 函数 映射 ， 它 主要 用 于 模式 分 类 和 特征 摘 
取 
6. 神经 网 络 的 学 习 规则 
计算 机 的 机 器 学 习 分 为 三 类 : 死记 式 学 习 、 从 例子 中 学 习 和 无 导师 学 习 。 神 经 网 络 的 
学 习 亦 可 作 类 似 的 分 类 .例如 一 类 网 络 事先 设计 成 记忆 特殊 的 模式 ， 以 后 当 给 定 有 关 该 系 
统 的 输入 信息 时 ， 它 们 就 被 回忆 起 来 ，Hopfield 模型 m， 即 是 这 类 死记 式 学 习 的 例子 ， 而 


(d) 
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许多 网 络 则 是 从 例子 中 学 习 ba， 在 学 习 时 往往 先 给 网 络 提供 一 个 输入 模式 ， 通 过 期 望 输 
出 的 最 佳 估计 ， 网 络 对 它 作出 响应 ， 然 后 教师 给 出 正确 的 输出 模式 。 若 有 必要 ， 则 允许 系 
统 调节 权 值 ， 使 得 内 部 表示 和 更 接近 期 望 的 结果 ， 感 知 器 就 是 这 种 教师 学 习 的 例子 .。 另 一 类 
网 络 则 设计 成 不 需要 教师 直接 指点 的 学 习 方式 ， 如 竞争 学 习 系统 00。 其 学 习 过 程 为 : 给 
系统 提供 的 动态 输入 信息 流 ， 使 得 各 个 单元 成 为 具有 不 同 输入 特性 的 特征 检测 器 ， 从 而 将 
事件 空间 分 为 有 用 的 多 个 区 域 。 自 适应 共振 网 络 吧 就 是 无 教师 学 习 的 例子 . 

学 习 规 则 可 以 分 为 三 类 ， 即 

D 相关 规则 : 仅仅 很 据 连接 间 的 激活 水 平 改 变 权 和 矩阵 ; 

2) 纠 错 规则 : 依赖 于 输出 结 点 的 外 部 反 人 局 改变 权 和 矩阵 ; 

3) 无 教师 学 习 规 则 : 学 习 表 现 为 自 适应 于 输入 空间 的 检测 规则 。 

在 人 工 神经 网 络 中 ， 学 习 规 则 是 修正 权 的 一 个 算法 ， 以 便 获得 合适 的 映射 函数 或 其 它 
系统 性 能 .Hebb 学 习 @ 的 相关 假设 是 许多 规则 的 基础 尤其 是 相关 规则 ); Hopfield 神 
经 网 络 和 自 组 织 特征 映射 展示 了 有 效 的 模式 识别 能 力 ， 纠 错 规则 常 使 用 梯度 下 降 法 ， 它 存 
在 局 部 极 小 问题 ， 无 教师 学 习 规 则 提供 了 新 的 选择 ， 它 利用 自 适应 学 习 方 法 ， 使 结 点 有 选 
择 地 接收 输入 空间 上 的 不 同 特 性 ， 从 而 抛弃 了 普通 神经 网 络 学 习 映 射 函 数 的 学 习 概念 ， 并 
提供 了 基于 检测 特性 空间 的 活动 规律 的 性 能 描述 ， 


14.2 Hopfield 模型 和 旅行 商 问题 


14.2.1 引 言 


组 合 优化 产生 于 现实 世界 中 寻找 最 优 值 的 问题 ， 它 的 目标 是 求解 友 观 客观 手 界 的 多 
变量 函数 的 极 值 。 由 于 问题 本 身 的 复杂 人 性， 组合 优化 中 的 很 多 问题 往往 是 NP -完全 
的 。 象 旅行 商 问题 ， 图 划分 问题 等 ， 因 此 人 们 只 好 用 能 在 多 项 式 时 间 内 求解 的 启发 式 算 
法 来 寻找 满意 解 以 满足 实际 工作 中 的 需要 . 但 启发 式 算法 存在 着 以 下 不 足 ， 首 先 它 与 问 
题 特例 有 关 。 如 针对 某 一 特定 领域 设计 的 高 效 算法 对 其 它 问 题 可 能 会 失效 ， 其 次 用 启发 
式 算法 求解 组 合 优化 问题 一 般 是 在 软件 层次 上 开展 工作 ， 与 飞速 发 展 的 超大 规模 集成 电 
路 (VEST) 的 联系 不 是 十 分 密切 。 再 者 以 搜索 为 基础 的 启发 式 算法 与 人 脑 处 理 问 题 的 模 
式 有 着 较 大 的 差距 。 所 以 人 们 在 不 断 完善 已 有 的 算法 基础 上 ， 一 直 在 寻找 新 的 计算 模型 
以 更 加 有 效 地 解决 客观 世界 中 的 优化 问题 。 

Hopfield” 开创 性 的 在 物理 学 、 神 经 生物 学 、 计 算 机 科学 等 领域 同 架 起 了 桥梁 ， 他 提 
出 并 证 明了 : 在 高 强度 连接 下 的 神经 网 依靠 集体 协同 作用 能 自发 产生 计算 行为 这 一 科学 
论断 ， 开 尽 了 神经 网 模型 在 计算 机 科学 应 用 中 的 新 天 地 ; 开创 了 一 条 组 合 优化 的 新 途 
Z. MS, Kirkpatrick S A P 提出 了 “模拟 退火 ”法 ，Durbin 等 人 ”提出 了 “弹性 
Pa? Ho Kohonen"! 提出 了 “ 自 组 织 映 射 ”方法 等 可 用 于 组 合 优化 的 计算 模型 。 用 神经 
网 来 进行 组 合 优化 处 理 日 益 受 到 人 们 的 重视 . 


DAwy=aSS,. a»0, Hi j 神经 元 同时 兴奋 (Si= 5 = 中， 则 它们 之 间 的 连接 应 加 强 。 
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由 于 Hopfield — Tank 模型 (以 下 简称 HT 模型 ) 影响 最 大 ， 时 间 性 能 上 最 优 ， 本 节 
以 它 为 重点 展开 讨论 ， 其 他 模型 留 在 下 节 中 讲述 .在 第 二 小 节 中 分 别 介绍 Hopfield 离散 
和 连续 两 种 模型 ， 通 过 对 神经 元 的 输入 输出 关系 ， 运 动 方程 和 网 络 的 能 量 函数 这 三 个 方 
面 的 数学 描述 ， 揭 示 了 Hopfield 神经 网 就 是 极 小 值 求解 机 这 一 计算 特征 .在 第 三 小 节 结 
合 旅 行商 问题 (TSP) ， 闹 述 能 量 函 数 在 HT 模型 中 的 重要 作用 ， 在 第 四 小 节 中 提出 了 一 
个 基于 邻接 矩阵 的 能 量 函 数 ， 它 具有 运算 速度 快 ， 解 的 质量 高 ， 便 于 VLSI 实现 等 优点 ， 
是 对 HT 模型 的 一 个 较 大 的 改进 ， 


14.22 ”Hopfield 模 型 简介 
我 们 将 从 神经 元 的 输入 输出 关系 ， 运 动 方 程 和 网 络 的 能 基 函 数 这 三 个 数学 概念 出 发 
来 描述 Hopfield 神经 网 络 . 
Ll 离散 异步 Hopfield 模型 
离散 异步 的 Hopfield 模型 是 最 早 提出 的 ， 它 与 统计 物理 学 中 的 自 旋 玻璃 态 有 着 对 应 
关系 ， 是 以 后 要 介绍 的 连续 确定 型 模型 的 基础 
离散 模型 中 每 个 神经 元 的 输入 u, 和 输出 满足 阶梯 函数 : 
V, = step(u;) (14.2.1) 
不 妨 假 定 V, 只 取 0 和 1 两 个 值 ， 则 其 输入 输出 关系 见 图 14.4(a)。 
每 个 神经 元 i 与 其 它 神经 元 /都 有 联系 ， 用 连接 强度 7,， 表 示 第 j 个 神经 元 对 第 i 个 
神经 元 的 输入 连接 强度 ， 它 类 似 于 真实 神经 元 的 突 触 连接 强度 。 神 经 元 i 的 输入 有 两 类 : 


一 是 外 部 输入 了 Li 另 一 来 自 其 它 神经 元 ， 因 此 神经 元 ; 的 总 输 和 人 是 : 了 TL V, eL. 


() 07 1 MAME (b) 判断 电路 
图 14.4 离散 神经 元 


每 个 神经 元 以 平均 速度 W, 随机 地 长 变 其 状态 ， 变 化 规律 遵循 如 下 的 运动 方程 : 

v= i (14.2.2) 
o YT, Vv, +i <u, 

其 中 u ASSIA, E 14.40). 
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DRAM PE E HORE 是 对 称 的 且 对 角 线 元 素 为 零 ， 构 造 如 下 的 能 量 函 数 : 
= -3XET, VV, -EIV + Yu, (14.2.3) 
我 们 考察 由 于 某 个 神经 元 i 的 改变 AV, TSR E HRPE AE: 
AE=— [z7, V +I- u Jar, 
方 括号 内 从 好 是 方程 (14.2.2) 右 端的 判别 条 件 ， 它 和 AP, 同 号 ， 所 以 : AE < 0。 
ATERA 五 是 有 界 的 ， 这 种 随机 异步 的 变化 过 程 必然 趋向 稳定 状态 ， 将 状态 固 
EEN 维 超 立 方 体 的 顶点 上 ， 这 说 明 上 述 神经 网 络 能 对 (14.2.3) 式 的 函数 进行 极 小 值 运 
A. B) Hopfield 离散 模型 的 计算 函数 H 是 : 
H(E, V ) = min(£, V.) (14.2.4) 
ORV =). Vo o. VBE AOI. 
因此 ， 如 果 能 把 优化 问题 映射 成 (14.2.3) 式 的 能 量 函 数 形式 ， 即 么 就 可 用 Hopfield 模 
型 自动 进行 优化 处 理 了 . 
2. 连续 确定 型 模型 
离散 模型 中 的 神经 元 与 真实 神经 元 ， 甚 至 与 简单 的 电路 器 件 相 比 差别 很 大 ， 这 主要 表 
现在 : 第 一 ， 真 实 神经 元 的 输入 输出 关系 是 连续 的 。 第 二 ， 真 实 神经 元 由 于 存在 着 时 间 延 


迟 ， 其 运动 方程 应 由 微分 方程 刻 化 。 为 此 ，Hopfieldg 提出 了 连续 确定 型 模型 以 更 加 通 近 
真实 神经 元 ， 并 有 利于 VLSI 的 硬件 实现 和 改善 网 络 的 总 体 性 能 . 


(8) Sigmoid 输入 辖 出 关系 (b) 神经 元 电路 
图 14.5 连续 神经 元 
连续 型 神经 元 的 输入 输出 关系 是 一 个 单调 递增 的 Sigmoid BK, WA 14.5(a)， 其 方 


程 抽象 如 下 : 
V, gu) (14.2.5) 

每 个 神经 元 的 电路 图 如 图 14.50) 所 示 。 图 中 1, 是 刺激 电流 ， 用 于 维持 整个 网 络 的 活 
RRS. 9, AC, 分 别 是 放大 器 的 输入 电 胃 和 总 电容 ，7,， 是 第 个 神经 元 和 第 i 个 神 
BARUŞ, MIT I 17 R，，P， 的 两 个 输出 要 视 T,， 的 正 负 分 别 联 到 V, ERA 
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端 。 所 以 神经 元 的 RC 福 程 是 : 


C,(du,/dd= ET, V, —u,/ R +1, (14.2.6) 


Jb: 1/R,=1/p,+ 517R, 
7 
考虑 如 下 Lyapunov 能 量 函 数 : 
lont 
E= 375 T VV, + og! s; Mav - EL, (14.277) 


它 关于 对 称 和 矩阵 7 的 时 间 导 数 是 : 
dE 


dr - Ear, 7a T, y, —u/ R Lj 


= -ÈC (du, / df) - dv, / d 
7 


=- Ca Mav, /dy 

因为 g, 是 单调 递增 函数 而 C, 又 大 于 零 ， 所 以 每 项 和 非 负 ， 故 得 到 dE/dr&0. 

当 dE/ dt~=0 时 ， 可 得 dV,/ dt =0， 对 所 有 i 成 立 ， 即 系统 达到 稳定 状态 . 

这 说 明 具 有 式 (14.2.7) 的 系统 的 演变 过 程 就 是 在 [0,1]” 空间 内 寻找 极 小 值 稳定 点 KR 
BF) 的 过 程 ， 并 在 达到 这 些 点 后 稳定 下 来 。 因 此 这 种 神经 网 络 同样 具有 自动 求 极 小 值 
的 计算 功能 . 

而 高 散 模 型 和 连续 模型 的 对 应 关系 需 借 助 放大 系数 来 说 明 。 如 果 令 V, 8,(2u,)， 其 
中 4 表示 放大 系数 。 当 4 很 大 时 (1-t oo)， 离 散 模型 的 稳定 点 与 连续 模型 的 稳定 点 是 对 应 
的 。 当 4 有 限时 ， 极 小 值 点 位 于 [0,1]" 空间 的 内 部 。 因 此 在 实际 应 用 中 一 般 取 较 大 的 4。 


14.2.3 HT 模型 下 的 旅行 商 问题 

Hopfield 在 提出 连续 确定 型 模型 之 后 与 Tank 合作 ， 成 功 地 用 HT 模型 对 旅行 
商 (TSP) 这 一 经 典 的 组 合 优化 难题 给 出 了 一 个 满意 解 ， 为 神经 网 解决 组 合 优化 问题 开辟 了 
一 条 新 途径 只. 随后 人 们 将 其 应 用 到 模拟 电路 , 线性 规划 ,图 论 和 作 
业 分 配 等 许多 领域 中 be， 

HT 模型 是 Hopfield 连续 模型 的 应 用 。 下面 结合 TSP 问题 的 求解 ， 介 绍 一 下 用 HT 
模型 处 理 问 题 的 一 般 方法 ， 
1. 问题 的 表示 

选择 合适 的 表达 方法 使 神经 元 的 稳定 输出 对 应 于 问题 的 解答 . 

我 们 知道 TSP 问题 是 寻找 一 条 最 短 的 周游 4 个 城市 的 路 径 ， 如 果 yue[0,1]， 当 网 络 


BEM, AV, = 1 表示 第 天 个 城市 在 周游 中 第 工 次 被 走 到 ， 那 么 x 城市 的 向 
E: (0,0,0,1,0) 表示 它 第 4 次 被 走 到 。 而 5 个 城市 的 一 条 周游 路 径 BDEAC 表示 成 如 下 形 
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式 的 置换 矩阵 : 


moO wm > 
ooo ele 
o= oe on 
-09o pluv 
coo e ala 
oon oju 


因为 每 个 城市 仅 允许 访问 一 次 ， 因 此 矩阵 中 的 每 行 〈 列 ) Fulr-- t 1, Wit s 
个 1. 
2. 能 量 函 数 的 选取 

选择 合适 的 能 量 函 数 使 其 最 小 值 对 应 于 问题 的 最 优 解 。 

这 里 首先 要 保证 极 小 值 是 合法 的 ， 即 当 能 量 函 数 取 极 小 值 时 间 题 的 约束 条 件 被 满 
是 。 对 于 上 面 所 述 的 置换 矩 阵 的 约束 条 件 可 描述 如 下 : 


Em = LLL Vy + EE EVarvy *OEY, -Ny 
其 中 各 项 分 别 表示 每 行 《 列 ) 只 有 一 个 1， 总 共有 个 1 时 已 ak 取 最 小 值 零 . 


然后 构造 目标 函数 使 其 满足 约束 条 件 下 的 解 对 应 于 问题 的 一 个 满意 的 解 ， 对 于 TSP 
问题 ， 可 构造 如 下 : 


Egg — zr Ld ey VY yas *Yya) 


其 中 对 1 FRPR ARR A. . 

上 述 公式 表明 : MUR XO Y jd BERE HEZLOBREDGHASBSAT DH Y (Ei) 
必 有 两 个 1 表示 相应 的 两 个 城市 先后 被 走 过 。 当 约束 条 件 满足 时 ，E gg 就 是 周游 路 径 的 
总 长 ， 因 此 ， 总 能 量 函 数 是 : 


A B [^ 2 
E-5LíXLV,V,*52 LEVV nta EEV nM 
Y^ de vo rur x 


BEE La V aV yet ra 0428) 
E Hh FDICRIAARI BARRY A. HPS ARB T DU def 8. 
3. 模拟 神经 元 的 运动 方程 
对 于 式 (14.2.8) 的 运动 方程 是 : 


-08 
du, /dt- 一 z CV. 


其 中 += RC 是 时 间 常 数 ，xu,, /+ 的 存在 是 原 能 量 函 数 中 的 积分 项 所 致 ， 展 开 式 (14.2.9) 
可 得 : 


Wy, 
du, /d= - AX v, - BY Vp- CTLV,-N 
po Yer ru 


(14.2.9) 
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一 Dd gM v, + Vy) (14.2.10) 


在 HT 模型 中 ，。 神 经 元 的 输入 输出 取 自 如 下 函数 : 
V n = g(,) = (1 + tanh(du ,)) /2 (14.241) 
这 样 上 述 三 式 就 完全 刻 划 了 TSP 问题 的 HT 模型 . 如 果 用 软件 模拟 ， 可 采用 某 一 数 


值 方法 积分 方程 (14.2.10)， 其 算法 复杂 度 是 O(N'); 如 果 用 硬件 实现 ， 就 需 知道 连接 矩 
阵 7， 由 于 连接 系数 7,， 是 二 次 项 的 系数 ( 见 14.2.7)， PUT, — —9E/0V,0V, . M 


T 746,,0—0,) BS A —0,,) - C - Dd, (8, +9414) 
其 中 


nu 
1, i=j 时 
sio i#j 时 

对 此 问题 在 单机 上 模拟 实现 的 时 间 复杂 度 是 O(N“)， 故 在 模拟 上 一 般 以 神经 元 的 运 


动 方程 为 准 , 
4. 初 值 选 择 


选 一 组 初 值 vvw, 和 网 络 参数 4、B、C、 等 ， 运 行 该 网 络 以 求 得 解答 。 
正如 前 面 所 述 的 ，HT 模 型 与 初始 值 x% 有 关 。 在 TSP 问 题 中 原则 上 可 选 


Wy 一 1/ 为 每 个 神经 元 的 初始 值 ， 因 为 它 满足 忆 忆 xz — N. 但 由 于 相同 长 度 的 等 价 路 


径 有 2N 条 ， 系 统 无 法 从 中 决 择 ， 所 以 要 加 一 定 的 燥 声 值 ( 土 0.1x，) 来 打破 这 种 平衡 . 
关于 各 种 参数 的 具体 值 见 文 [9]， 有 关 模 氢 过 程 见 文 DI. 


14.2.4 HT 模型 的 改进 


HT 模型 虽然 在 时 间 人 性 能 上 有 着 较 大 的 优越 性 ， 但 在 实验 中 发 现 网 络 存在 着 不 稳定 
TERIS EC UAE GAIA. MERE Wilson" 指出 :在 城市 数目 入 = 10 时 只 有 8% 是 
有 效 解 和 找 不 到 N = 64 的 网 络 参 数 后 这 个 问题 显得 尤其 尖锐 。 问题 出 现在 最 后 阶段 ， 但 
毛病 的 根源 来 源 于 前 三 步 ， 为 此 展开 了 大 量 的 研究 工作 . 


在 问题 表达 方面 ，BrandtD 提出 了 一 个 三 下 标 表示 方法 ， 即 Vs 为 1 表示 从 第 i 个 
城市 到 第 / 个 城市 第 大 次 被 走 到 ， 这 样 路 径 总 长 就 是 : DEL, Vyp 其 优点 是 : 数据 
Kd, 仅 是 能 量 冰 数 中 一 次 项 的 系数 ， 它 与 了， 无 关 ， 有 利于 硬件 电路 的 实现 ， 但 它 需 
要 O(n ) 个 神经 元 ， 计 算 量 很 大 . 

ERRAI. Szu 38 Brandi" 等 提出 了 一 个 约束 加 强 的 能 量 公式 : 

Egy = LOL 7D + LO, D (14.2.11) 
IRR STELLA " — A) 中 的 神经 
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元 ， 抑 制 过 多 的 1 出 现 . 
虽然 上 述 表示 方法 提高 了 收敛 性 ， 但 由 于 目标 函数 未 加 改变 ， 所 以 解 的 质量 不 是 很 高 . 
对 于 神经 元 的 运动 方程 (14.2.9)， 一 般 采 用 Euler 差分 法 ， 邑 : 
alt oy! (1-44) OE .Ai (14.2.12) 


x x z 8V. 
通常 采用 很 小 的 Ac 以 逼近 真实 情况 。 如 Wilson 取 Ar = 10 -5， 因 此 模拟 的 速度 很 
We. Su 取 Ai 7 4 二 1， 使 运动 方程 成 为 梯度 函数 以 加 快运 行 速度 。 事实 上 ，At MEREK 
大 也 不 能 过 小 ， 要 结合 放大 系数 1 综合 考虑 .车 At 太 大 ， 则 会 丢失 菜 些 历史 信息 ,使 
hui" 与 无 关 ， 忘 记 了 某 些 先前 的 正确 决策 ， 若 At 太 小 ， 则 得 不 到 及 时 的 反馈 信 
息 ， 容 易 无 所 适 从 ， 下 面 介绍 的 模型 中 ， 控 制 1At /+ 1， 以 便 平衡 各 方面 的 因素 ， 可 以 
取得 较 好 的 效果 . 
针对 上 述 能 量 函数 的 不 足 ， 我 们 介绍 一 个 以 边 为 主 的 邻接 矩阵 公式 ， 当 一 1 
表示 从 顶点 天 到 顶点 ;的 这 条 边 被 选中 ， 例 如 BDEAC 这 条 周游 路 径 的 邻接 矩阵 是 : 


mua >! 

-e-ec|- 
See oon 
Sooo- 
oo~olp 
o= ooru 


其 中 VY, =0. BRAEMAR. V, =V, 表示 边 中 的 两 个 顶点 是 对 称 的 。 
因此 这 个 对 称 阵 的 能 量 函 数 是 : 


e-40007, -» +F LOY, -».cYr ¥,0-V,) 
Tod "m 1j 


*DYY4,V, (14.2.13) 
其 中 前 面 两 项 表示 每 行 ， 每 列 有 两 个 1， 第 三 项 表示 对 称 关系 。 这 个 能 量 函数 具有 如 下 优 
点 : 


D 整个 网 络 只 需 N? —N 个 神经 元 ， 比 其 同类 模型 Brandt“ 少 了 一 个 数量 级 ， 

2) 在 TSP 问题 中 ， 任 何 一 个 解 都 有 2N 一 1 个 等 长 路 径 与 之 对 应 对称 性 的 引入 自 
动 实现 了 边 的 双向 性 ， 减 少 了 解 的 等 价 类 数 自 ， 提 高 了 网 络 的 计算 效率 . 

3) 神经 元 的 运动 方程 是 : 


du,/ dto —uy/«— A(X v, —2-B(LV,, -22)- C0 -2V ,) - Dd, (14.2.14) 
其 中 数据 项 4， 直接 施 力 于 方程 04214) 能 产生 较 优 的 解 . 


4) 数据 项 d,， 在 能 量 消 数 中 线性 出 现 ， 使 得 它 仅 以 偏 流 的 形式 出 现在 输入 中 ， 网 络 


的 连接 矩阵 是 固定 的 ， 不 以 问题 实例 的 改变 而 变化 ， 有 利于 VLSI 的 实现 ， 即 
I7 — (4 € B) C 4 Dd, (14.2.15) 
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T nry 45 yy + BE — 2C8y, Sy (14.2.16) 
M (14.2.16) 式 中 还 可 以 看 出 : 神经 元 间 的 连接 复杂 人 性 已 有 所 降低 ， 从 Hopfield 的 全 
连接 变 为 仅 与 本 行 、 本 列 和 对 称 元 素 连接 了 . 这 同样 有 利于 VLSI 的 硬件 实现 。 
实验 结果 表明 : 上 述 模型 容易 产生 非法 回路 因而 导致 非法 解 ， 这 里 的 非法 回路 是 指 
顶点 个 数 小 于 N 的 回路 。 而 这 个 问题 是 单 层 网 络 所 元 法 解决 的 ， 为 此 引信 第 二 层 探测 网 


络 来 进行 非法 回路 的 检查 和 纠正 "” 

设 4 为 图 G 的 邻接 矩阵 ，7 为 单位 矩阵 ， 则 令 忆 一 了 (4 + D TRO, BRDA 
和 之 间 的 连通 性 如 果 第 一 列 元 素 5 — 0， 那 么 顶点 ;不 能 从 顶点 1 到 达 ， 即 是 说 所 
Hb, 一 1 的 顶点 将 形成 非法 回路 ， 所 以 第 二 层 网 络 的 每 个 元 素 5,， 和 第 一 层 的 V， 相 
连 ， 通 过 B, |, ERRA ( 最 多 NK) 就 可 检查 出 是 否 存在 着 非法 回路 。 一旦 找 出 非 
法 回路 ， 可 通过 偏 流 I, 的 作用 来 抑制 小 回路 的 生成 。 即 是 


0, 4S,,=1, VxeleN 
AL,, =$ U4 pax — dy), 4S,=1-Ss 
n 当 Sy = Sh 


这 里 Sy, 是 第 二 层 的 输出 . 条件 1 表示 X RI Y 同 在 一 个 同 路 中 ， 条件 2 表示 XX 和 了 不 在 
一 个 回路 中 ， 它 们 分 别 属 于 不 同 的 划分 ， 这 时 增 大 刺激 电流 使 它们 建立 联系 ， 条 件 3 则 说 
明 抑 制 同一 非法 回路 中 的 顶点 建立 联系 ， 这 样 ， 最 终 所 有 顶点 将 和 顶点 | 同属 一 个 回路 ， 
即 是 合法 的 周游 路 径 ， 

由 此 可 网， 引入 第 二 层 检查 和 纠正 网 络 ， 使 Hopfield 模型 增强 了 活力 ， 具 有 自学 习 
的 功能 ， 提 高 了 问题 求解 的 能 力 。 


143 其 他 模型 和 旅行 商 问题 


本 节 以 TSP 问题 为 例 介绍 其 他 神经 网 模型 在 优化 计算 中 的 应 用 。 一 方面 通过 对 各 模 
型 的 简单 介绍 ， 使 得 对 各 种 模型 有 个 基本 的 了 解 ; 另 一 方面 通过 对 TSP 问题 的 研究 ， 希 
望 能 起 到 举一反三 的 作用 ， 以 便 推 广 应 用 到 其 他 图 论 问题 的 求解 ， 本 节 所 介绍 的 中 种 方法 
两 两 相似 ， 即 弹性 网 法 和 自 组 织 映射 比较 类 似 ， 模 拟 退 火 和 均 场 退火 有 共同 之 处 ， 因 此， 
我 们 除了 介绍 这 些 方法 本 身 外 ， 还 同时 进行 简单 的 比较 ， 以 加 深 对 各 模型 的 掌握 和 了 解 。 


14.3.1 弹性 网 法 


弹性 网 法 (Elastic Net Method) 是 Durbin 和 Wilshaw 负 提出 的 一 个 并 行 模 氢 算法。 该 
算法 基于 几何 观点 考虑 问题 ， 即 一 条 周游 路 径 是 圆周 到 城市 所 在 平面 的 映射 。 我 们 考虑 这 
样 一 个 映射 ， 它 把 圆周 上 的 一 些 点 映射 到 平面 上 的 一 组 点 ， 使 得 圆周 上 的 相 邻 点 经 映射 后 
尽 可 能 地 保持 接近 ， 算 法 的 过 程 就 是 不 断 地 修改 映射 过 程 ， 即 不 断 地 计算 在 城市 平面 上 映 
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射 像 点 的 位 置 使 它们 保持 邻近 性 由 于 最 初 圆周 位 于 城市 分 布 的 中 心 处 ， 它 不 断 地 向 四 周 
任意 扩张 ， 最 终 通 过 (或 接近 ) 所 有 城市 ， 从 而 形成 一 条 周游 路 径 。 因 此 ， 在 TSP 问题 
中 周游 路 径 的 几何 约束 条 件 是 自然 满足 的 。 并 且 ， 路 径 中 的 每 一 点 在 移动 过 程 中 受 两 种 力 
的 影响 ， 第 一 种 力 使 得 它 向 最 近 的 城市 运动 ; 第 二 种 力 是 邻居 间 的 张力 又 使 总 的 路 径 最 
i. 这 样 ， 一 个 城市 在 点 的 运动 中 就 有 可 能 和 路 径 中 的 某 一 段 相关 而 不 仅 只 和 一 个 点 对 
应 ， 这 种 关系 的 紧密 程度 和 城市 与 点 、 点 与 点 间 的 距离 有 关 。 起 初 所 有 的 城市 对 路 径 中 的 
每 点 施加 大 致 相同 的 影响 。 随 后 ， 上 距离 远 的 影响 逐渐 减弱 ， 每 个 城市 只 和 与 它 最 接近 的 点 
AR. 这 种 演化 过 程 可 由 平滑 半径 参数 天 来 控制 ， 使 得 运动 点 趋向 于 城市 点 

由 此 可 见 ， 这 种 算法 之 所 以 称 为 弹性 网 法 ， 是 由 于 它 像 一 根 有 弹性 的 橡皮 条 从 最 初 状 
态 不 断 地 发 生 形变 ， 最 终 导致 一 条 周游 路 径 ， 

如 果 用 向 量 x; 来 表示 城市 的 位 置 坐标 ， 向 量 表示 路 径 中 的 某 点 /的 位 置 坐 标 ， 那 
ACHE BE: 


E= "Ein( ow kx, — LK) + BY 一 ?下 


其 中 o(d,K) 是 一 个 正 的 、 有 界 的 、 BL d BROOME. 4d>KN, CATS. 在 文 [4] 
中 ， 取 old, K) = exp( — 4^ / 2K). RBA EMMA NERT LRM MA. W a0 p 
分 别 奖 定 了 两 种 力 的 作用 大 小 。 平 滑 半 径 K 刻 划 了 路 径 上 的 点 与 城市 的 接近 程度 。 在 极 
限 情 况 下 ， 天 一 0， 为 了 使 得 有 界 ， 极 限 路 径 就 必须 经 过 所 有 的 城市 (和 否则，d 
#0, o(d,K)— 0,— InY'o(d,K)-« + co). 

?的 座 标 由 梯度 下 降 法 来 决定 ， 即 是 


亦 即 
Ay, =a} W (x, —y ) 4 BKO 


其 中 


er PTI) 


9C, — 9 LK) 
Lot be, -y, MO 


由 此 可 见 ， Zefa AAS, 使 得 导数 运 
算 方 便 。 

由 于 蕊 是 洪 着 负 梯 度 方向 变化 ， 所 以 下 是 不 断 
减少 的 ; 而 五 是 有 下 界 的 〈 最 优 解 )， 因 此 上 述 过 程 
必 将 到 达 一 个 EE 的 极 小 值 而 稳定 。 在 极限 情况 下 ，K: 
一 0， 路 径 点 数 趋 于 无 穷 ， 最 终 通 过 所 有 城市 ， 并 获 
得 能 基 最 小 值 后 达到 最 优 解 ， 这 暗示 我 们 : 使 用 弹性 
网 算法 ， 即 使 不 在 极限 状态 下 也 能 得 到 较 好 的 解 。 

综 上 所 述 ， 弹 性 网 算法 就 是 同时 求解 一 组 差分 方 
程 的 过 程 ， 这 是 一 个 并 行 操作 过 程 ， 适 合 于 硬件 上 的 


图 14.6 运动 点 性 和 城市 C; OSI 
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并 行 实现 。 具 体 模拟 时 ， 还 需 确定 x、8， 路 径 中 的 点 的 个 数 (如 2N) ABM K HEE 
和 递减 规律 ， 详 见 文 图 - 

用 弹性 网 法 所 得 到 的 解 ， 其 质量 是 很 高 的 、 对 100 个 城市 所 得 到 的 次 优 解 仅 比 最 优 解 
差 1%， 但 需要 相当 长 的 收 伍 时 间 。Burrf 利 用 对 称 原理 进行 的 改进 工作 大 大 减少 了 所 需 
的 计算 时 间 ， 如 前 所 述 ，Durbin~ 一 Willshaw 只 利用 了 两 种 力 ， 即 城市 对 运动 点 的 前 向 拉 
Ji ,和 顶点 间 的 张力 T, 如 图 14.6 所 示 。 

Burr 引入 第 三 种 后 向 力 B, CHART Cl 最近 顶点 1* (CD 所 决定 ， 可 看 成 是 把 城市 
拉 向 周游 路 径 。 三 种 力 的 合成 效果 使 得 运动 点 向 城市 分 布 较 密集 的 区 域 运动 ， 而 周游 路 径 
最 短 由 张力 了 ,来 保证 .运动 点 1 的 运动 方程 是 : 

Al 一 aX, ~S,B)+T, 

= aX [cw c, —t)4S,(C,-2° c») a ttp 720))72 

其 中 w, WEGE. S, — oC (C) (L7 Dol C (C) - 1,5 £s £ (C) 48— 18 


数 ， 它 给 出 与 城市 C, 最 近 的 点 的 位 置 . 

车 把 上 式 中 的 第 一 项 看 作 是 确定 距 C, 最 近 点 的 期 望 值 ， 那 么 引入 的 第 二 项 则 是 在 计 
算 真 正 的 最 近 点 .模糊 计算 和 精确 计算 相 结 合 ， 可 使 每 步 的 决定 更 加 准确 ， 从 而 提高 了 
收敛 速度 。 

为 保证 解 的 高 质量 ， 平 滑 参 数 KK 取 平 均 接近 距离 ， 即 


1 

x -p[ Yi, i co/N] 
这 里 的 天 相当 于 第 三 小 节 中 模拟 退火 时 温度 的 作用 ， 它 逐渐 减少 导致 了 解 的 质量 不 断 所 
高 ， 
值得 指出 的 是 : 多 个 TSP 问题 "9 在 弹性 网 模型 中 很 容易 解决 .只 要 放 署 多 个 初始 贺 


让 它们 按照 上 述 原则 不 断 扩 张 ， 最 终 将 得 到 多 个 TSP 问题 的 解答 。 不 过 初始 圆 的 位 置 将 
与 最 终 解 有 关 ， 见 图 14.7. 


图 14.7 多 张 弹性 网 下 的 多 TSP HE 


14.3.2” 自 组 织 映射 
现实 世界 中 神经 元 间 的 联系 并 不 是 一 成 不 变 的 ， 而 是 一 个 随 外 部 环境 不 断 演化 的 过 
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Æ. Kohenen!™ 97 $2 H 9 Bi LA we AT (Self-Organizing Maps) 较 好 地 模拟 了 神经 元 在 无 导 
师 状 态 下 适应 环境 变化 而 自学 习 的 过 程 ， 具 有 理论 和 实际 应 用 上 的 重要 意义 。 本 小 节 着 重 
探讨 自 组 织 喘 射 的 计算 能 力 ， 以 TSP 问题 为 例 说 明 自 组 织 映射 在 组 合 优化 中 的 应 用 。 

L 模型 简介 

Kohenen 自 组 织 映射 是 一 个 拓扑 保 序 正 射 ， 它 把 高 维 空间 的 信号 映射 到 低 维 空间 
A (通常 是 二 维 高 散 空 间 ) 并 尽 可 能 地 保持 拓扑 〈 相 邻 ) 关系 不 变 。 如 图 14.8 所 示 ， 手 
党 面 的 五 个 区 域 经 映射 后 虽然 位 置 已 有 所 改 变 ， 但 相 邻 关系 保持 不 变 。 WTH D. L 
M、R 都 还 相 邻 等 。Kohenen 自 组 织 模型 正 是 基于 这 种 拓扑 保 序 映射 ， 它 通过 4 空间 上 
的 自学 习 算 法 ， 体 现 了 高 维 空间 VV 的 某 些 重要 特征 ， 以 适应 外 部 的 环境 . 

一 般 的 Kohenen 自 组 织 映射 学 习 算法 可 描述 如 下 : 

设 ?ez 是 高 维 空间 中 的 一 个 输入 信 号 ， 在 每 一 学 习 步 又 中 ，，" 依 概率 P(Y) 而 定 。 二 维 
网 格 4 中 > 处 有 一 向 量 Wev, Uit 4 中 的 地 址 > 映 射 到 VO 权 ,， 并 以 如 下 规律 变 
化 : 

0) 确定 最 近 点 s， 使 得 Iw, -»l= min(IW, — vp. 其 中 vy 是 当前 输入 的 随 


机 向 量 ， 
(2) 对 所 有 s WEE, BW, WAW, meh, (v 一 WW,)。 这 里 ,是 一 预先 指定 
的 邻居 修改 函数 ， 通 常 0<h,, < 1， 且 在 + =s 处 最 大 、 并 随 着 jr — sl 的 增 大 而 趋 于 
56. WARE r 的 邻居 范围 内 起 作用 。 而。 是 一 个 反映 学 习 步 长 大 小 的 参数 ， 这 样 ， 随 着 学 
习 的 不 断 深入 ，s Ah 的 作用 越 来 越 小 ， 上 述 算法 最 终 产生 的 7 AERE w, HEAT Vr de 
某 些 顶点 对 应 并 保持 拓扑 的 不 变性 
在 下 面 ， 我 们 将 讨论 如 何 选择 A, 和 上 以 解决 TSP 这 一 图 论 中 的 难题 。 


r 


图 14.8 SAARI 


2 BARS FA TSP 问题 
用 Kohenen 模型 求解 TSP 问题 的 直观 想法 和 弹性 网 类 似 号: 用 圆周 点 到 城市 点 的 拓 
一 289 一 


TMRUTEUM, ICRI PL E ds IA ERC AT A EG. ATREA PE 
Bee. ` 
形式 化 的 算法 描述 如 下 : 

YEA. Ap om A, 是 [0,1]7 ERRETA. xp xp nn xy 是 [0.1] 上 的 一 个 
环 . BKN, x, 的 邻居 ri) 定义 为 : r= (Ie E — 1,1 1,] mod N}。 环 中 各 点 在 1 
时 刻 的 位 置 由 X'=(x', xe oe, Xy ER. 初始 时 : X? = (zx US Ky ye 

LIMES ULM SPEI DES E FEE 
取 某 个 城市 4 ,的 概率 是 1 / n. 那么 TSP 算法 是 : 

(1) Hog Ther C), E 


mn 


i£ x) l= miniis] 


MSE ERRA y" 
(2) 修改 规则 如 下 : 


(nl 


x; -(-—28x, xat ier(i (0) 
xy =x), KE 
B. £20. £250. . 
再 指定 !。 (BE) . 2 ( 步 长 ) BERAR” 就 可 用 Kohenen 模型 对 TSP 问题 求解 


了 . 
上 述 算法 中 ， 距 离 的 作用 并 不 突出 ， 而 TSP 问题 所 关心 的 从 是 最 短 周 游 路 径 。 为 
此 ， 下 而 我 们 经 过 一 些 简单 的 运算 ， 得 到 显示 的 距离 表示 形式 . 
设 4,, = lA AN RIAR k HERPEN. 
DD ;= ix, A M RPA UN BRTH. 
则 矢量 A、B、 pru 角形 。 和 根据 三 角 等 式 ， 我 们 有 : 
IAB? + JACI’ —24B- AC = 8C]? 
BRETA, WARNE j, 的 邻居 ier(j,( 人 )) 


[221 1 [21 "ng 7 


Di 一 Di ,= M, x -4 x? tA x, - 14 x; Vv 
SJA Y 24,4, A ed x P Ma xl 
RAI, m 
DU -D,-6MA, le20—24 4, nA xUEü- A x - A xr 
利用 三 角 等 式 ， 可 得 : 


fel i D a 
D, -D, 07 ^5 _-d-ala, +p; - 5] «a-2 D, -D 


ij 
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因此 ， 修 改 规则 如 下 : 

人 di +a, -( o, + 区 +sD |, ieri.» 

D t+] =D t HE 

这 里 Dy 就 可 看 成 是 神经 元 间 的 连接 强度 ;Kohenen 学 习 算 法 使 得 某 些 神经 元 的 连接 强度 
增强 ， 某 些 逐 渐 减 弱 ， 运 动 顶点 不 断 向 城市 靠 扰 而 形成 一 条 周游 路 径 ， 见 图 14.9 所 示 . 

模拟 当中 一 般 取 s= 1 / (Hogt e= sre (0<5<1), N-2n—2.5n, HEAR 
BERD RAZA, 

最 后 需要 说 明 的 是 : 尽管 弹性 网 和 自 组 织 映 射 有 相似 之 处 但 它们 存在 着 如 下 区 别 。 首 
先 ， 弹 性 网 法 是 确定 性 算法 而 自 组 织 映射 是 概率 型 的 ; 其 次 自 组 织 映 射 比较 通用 而 弹性 网 
中 的 能 量 函 数 是 为 TSP 特制 的 . 


14.3.3 ”模拟 退火 

模拟 退火 (Simulated Anneajing， 以 下 简称 SA) 算 法 的 思想 最 早 是 由 N.Metropolis 等 
AF 1953 年 提出 的 ， 但 把 它 用 于 组 合 优化 却 是 在 1983 年 由 S.Kivkpatrick AU H 
的 ， 模 拟 退 火 算法 将 组 合 优化 问题 与 统计 力学 中 的 热平衡 问题 类 比 ， 另 腑 了 一 条 求解 组 合 
优化 问题 的 新 途径 ， 它 通过 模拟 退火 过 程 ， 可 找到 全 局 (或 近似 ) 最 优 解 。 模 拟 退 火 算法 
是 基于 Monte Carlo 和 迭代 求解 法 的 一 种 启发 式 随机 搜索 算法 。SA 算法 用 于 解决 组 合 优化 


问题 的 出 发 点 是 基于 物理 中 晶体 物质 的 
退火 过 程 与 一 般 组 合 疝 题 间 的 相似 性 ， / 
ina 
Tun 
(anal 


在 对 固体 物质 进行 退火 处 理 时 ， 通 常 先 
将 它 加 漫 熔化， 使 其 中 的 粒子 可 自由 送 
动 ， 然 后 随 着 温度 的 逐渐 下 降 ， 粒 子 也 
逐渐 形成 了 低能 态 的 晶 格 . 若 在 凝结 点 / 


附近 的 温度 下 降 速 率 足够 慢 ， 则 固体 物 
质 一 定 会 形成 最 低能 量 的 基态 .对 于 组 


合 优化 问题 来 说 ，. 它 也 有 这 样 的 类 似 过 —— 
程 。 组 合 优化 问题 解 空 间 中 的 每 一 点 都 x "n Da 
代表 一 个 具有 不 同 目标 函数 值 的 解 .所 i 


谓 优化 ， 就 是 在 解 空间 中 寻找 目标 函数 
最 小 CK) 解 的 过 程 。 若 把 目标 阔 数 看 
成 能 量 钞 数 ， 某 一 控制 参数 视 为 温度 
T， 解 空间 当 作 状态 空间 ， 那 么 SAK 图 149 双 层 网 络 : 上层 是 环 ， 下 层 是 城市 
法 寻找 基态 的 过 程 也 就 是 求 目标 函数 极 小 值 的 优化 过 程 . 
1 模拟 退火 简介 
设 8= Ts，…，st} 为 所 有 可 能 的 组 合 状态 集合 ，C:8~ 尺 为 非 负 目 标 函 数 ， 
即 C(s,) 2 0 反映 取 状 态 为 解 的 代价 ， 则 组 合 优化 问题 可 形式 地 表述 为 寻找 *"eS， 使 得 
C(s*)=minC(s) Vases 
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SA 法 的 基本 思想 是 : 把 每 种 组 合 状态 5 看 成 某 一 物质 体系 的 微观 状态 ， 而 C(s) 看 成 
该 物质 体系 在 状态 s 下 的 能 量 ， 并 用 控制 参数 TERRIER. 让 从 一 个 足够 高 的 值 慢 
EFE. XE T, JB Metropolis 抽样 法 模拟 该 体系 在 此 了 下 的 热平衡 态 。 即 对 当前 状 
di s 懒 随机 扰动 产生 一 个 新 状态 zs， 计 算 增 量 AC’= C-C) HAER exp(-AC / bT) 
接受 "作为 新 的 当前 状态 。 当 这 样 的 随机 扰动 重复 足够 次 数 后 ， 系 统 将 达到 该 温度 下 的 热 
平衡 态 ， 并 且 系 统 的 状态 将 导致 Boltzmann 分 布 ，b 是 Boltzmann 常数 . 

模拟 退火 算法 的 主要 步骤 描述 如 下 : 


算法 14.1 SA-ALGORITHM 
procedure SA | Algorithm(is, To); 
/ +s 为 任 一 初 态 ，70 为 初始 控制 参数 */ 


begin 
Q0) sms, 5 C'—C,;; ke0 
/ * I Ci= C(5)，C 为 当前 代价 值 。 * / 
(2) repeat 
(2.1) repeat 


(2.1.1) s; «-Generate(s); 
(2.1.2) if CS C" then ses; 
else if Accept ( s) then s~s; endif 
endif 
(2.1.3) until / $5625; 
(2.2) Ty4,7-Update(T4; 天 天 HE 
(3) until T, & c 
end. 


上 述 算法 中 ，(1) 为 初始 化 ，(2.1.0) 的 Generate(s) 表 示 从 s 的 邻 域 中 随机 产生 下 一 个 状 
is, ， 若 Cjs C*， 则 接受 /为 新 的 当前 状态 ; 否则 仅 以 一 定 的 概率 接受 /为 新 的 当前 状 
A RERE Accepi KADR. Accept 函数 通常 取 如 下 形式 : 

function Accept (/ ,5); 

begin 
AC'«-C,-C'i 
if exp(-AC' / bT,)> Random(0,1) / + b 4 Boltzmann 常数 * / 
then Accept-truc 
else Accept«-false 
endif 


end. 
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(2.1.3) 中 的 内 循环 结束 条 件 是 指 在 每 一 温度 T, 下 先 代 多 少 次 以 达到 平衡 态 ， 而 (2.2) 
中 的 Update(Th) 函 数 则 表示 温度 每 次 下 降 的 速率 ， 由 此 可 知 ，SA 算法 有 3 个 重要 函数 : 
产生 函数 Generate， 接 受 函 数 Accept 和 温度 更 新 函数 Update。 在 实际 应 用 中 ， 初 始 温 
度 Tb， 内 循环 次 数 和 终止 条 件 也 是 影响 SA 算法 性 能 的 重要 参数 .下面 结合 TSP 问题 ， 
讨论 如 何 确定 函数 形式 和 各 参数 。 

2. 用 模拟 退火 法 求解 TSP 问题 

传统 的 启发 式 算法 主要 有 两 种 : 第 一 是 先 自 顶 向 下 的 分 而 治之 、 再 自 底 向 上 的 组 合 求 
解 的 分 治 法 ， 第 二 是 步 步 信心 以 达到 全 局 最 优 的 选 代 法 。 模拟 退火 法 可 看 成 是 上 述 两 种 方 
法 的 综合 ， 在 高 温 下 ， 它 是 大 粒度 的 分 治 法 ; 而 在 低温 下 是 细 粒 度 的 倪 心 法 ， 由 于 SA 算 
法 中 能 做 概率 性 的 扰动 以 跳出 局 部 极 小 ， 所 以 它 得 到 的 解 的 质量 一 般 很 高 . 

在 TSP 问题 中 ， 设 a= (iit ,in) 为 顶点 的 一 个 排列 ， 则 优化 且 标 函数 就 可 取 为 路 径 
长 度 ， 即 : cl(s,)= DAA 1，jTLN]。 产生 函数 Generate 可 定义 为 : 


ow 


function TSP. Generate(sj); 

/ 84 sss) 

begin 
i«Random(1,N-1) ; j-Random(itlN); 
return (Swap(i, $ s, 5, )) 


end. 


LCLIHEPISECEEELLIPEGITELDILME EET TON 
(XX (XXD)、 Xp DE BRM. X). Xp Xia (Xpo XD 和 
«, Xu ). 

温度 更 新 函数 Update(2) 可 取 : T,= d/ (t+ logl - k)) EE — BAH F MERE 
SA 算法 收敛 到 最 佳 解 ， 但 计算 时 间 太 长 ， 故 在 实际 应 用 中 通常 取 : Tvl = AT, 
0<4<1. 

检验 Metropolis 抽样 法 是 否 稳定 ， 一 般 取 : 

O 检验 Cts, ) 的 均值 是 否 稳定 ; 

@ C(s, ) 变化 很 小 ， 

总 之 ， 对 TSP 问题 而 言 ， 模 拟 退 火 算法 是 诸 神经 网 模型 中 最 好 的 一 种 指 解 的 质 
量 )， 目 前 所 能 处 理 的 城市 数目 已 达 6000 之 多 。 


1434 均 场 退火 


从 上 一 小 节 介绍 中 可 以 看 出 ， 模 拟 退 火 算 法 是 一 个 通用 的 、 与 领域 无 关 的 、 具 有 概率 
门 山 性 的 、 强 有 力 的 组 合 优化 算法 . 但 它 要 求 温度 下 降 得 足够 慢 ， 导 致 了 该 算法 的 计算 时 
间 很 长 。 均 场 退火 (Average Field Annealin 多 即 可 看 作 是 一 种 新 型 的 神经 网 计算 模型 ; 又 
可 视 为 是 对 模拟 退火 的 重大 改进 。 它 只 需要 在 某 个 关键 温度 附近 实施 退火 过 程 就 可 取得 较 
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好 的 效果 ， 使 得 该 算法 的 时 间 性 能 有 很 大 提高. 


L 模型 简介 
均 场 退火 可 由 下 述 方程 刻 化 : 
E= fV) (14.3.1) 
-2E of 
ET T» (14.32) 
y, =8(E pT) (14.3.3) 


其 中 : V=(,0,-~, 1 eRe Bh N 个 相互 制约 的 组 合 优 化 变量 ，E, 称 为 均 场 (Mean 
Field}, g 是 神经 元 输入 输出 的 Sigmoid 函数 ， 了 是 温度 控制 参数 ， 它 与 Hopfield 模型 中 
的 增益 系数 的 倒数 或 模拟 退火 中 的 温度 作用 相当 。 

所 谓 均 场 退火 就 是 在 某 一 个 关键 温度 附近， 按照 上 述 模 型 实施 模拟 退火 过 程 ， 以 
便 达 到 某 个 热平衡 态 ， 这 时 得 到 系统 的 一 个 较 优 解 。 下 面 结 合 TSP 问题 的 讨论 ， 介 绍 用 
均 场 退火 解决 组 合 优化 问题 的 一 般 方法 。 
2. 均 场 退火 下 的 TSP 问题 求解 

针对 Hopfield 模型 中 网 络 参数 的 难 确定 性 和 解 的 质量 不 高 等 缺点 ，Van den Bout 等 
人 D9 提 出 了 如 下 改进 方案 : 

(1) ”能量 函数 只 有 两 项 ， 即 


d 

E-FEEE bah yt yl DLV eV pier tM yer) (14.3.4 
它 只 保留 了 原 Hopfield 模型 中 置换 矩阵 表示 TSP 问题 的 列 约束 ， 这 样 就 很 容易 确定 参 
Xa, 即 d, = max f22 +e. 由 此 可 知 : 4, 为 两 点 间 最 大 距离 的 2 fie — m. AUR 
证 形成 合法 解 。 其 他 约束 条 件 由 下 面 的 规 一 化 过 程 所 满足 . 

(2) 神经 元 规 一 化 

神经 元 的 输出 状态 变量 了 上。 看 作 是 当 城 市 在 作 随机 热平衡 扰动 中 城市 X C i k 
RRR, CRM Boltzmann 分 布 ， 即 Vy, wexp(—E,/DHPE,, E1995, wr 
M (14.3.2) 中 算出 ， 即 

E,=4, x Vnt X Au U vu EV ua) (14.3.5) 
RRMA E, 大 的 ， 其 位 置 占有 概率 VV. ARR X RAT BEE P 
第 i 次 被 访问 ,了 越 小 越 容易 得 到 合法 解 ，T 越 大 解 的 质量 越 高 ， 为 了 得 到 真正 的 概率 ， 
对 神经 元 的 输出 六 ,进行 归 一 化 : 

V a =exp(— Ex/ T)/ [Xexp( E p TJ] (14.3.6) 


它 保证 了 每 个 城市 只 在 路 径 中 出 现 一 次 (VY =), GE SIT RRS ee HTT AR 
作用 . 
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从 (14.3.5) 和 (14.3.6) 两 式 中 可 知 :在 高 漫 时 ， 城 市 被 访问 的 位 置 占有 概率 是 均匀 


分 布 的 : 
Troo=Vyrl/n VXi 
在 低温 时 ， 城 市 向 具有 较 小 均值 的 位 
置疑 结 ， 它 使 得 整个 周游 路 径 最 短 。 假 如 
Q 两 个 城市 占据 了 相同 的 位 置 ， 必 然 会 留 下 
某 个 空位 置 ， 这 种 情形 是 维持 不 住 的 。 
"n 


为 在 d, KF ER PA A IB] CA EB RAE D ft 
e 时 ， 两 个 城市 无 论 哪个 占据 空位 置 都 将 得 
Hl 14.10 (a) 非法 路 径 由 于 两 个 城市 占据 了 同一 位 于 到 较 小 的 能 量 ， 所 以 系统 将 向 这 种 状态 演 
O) 合法 路 径 由 于 由 的 作用 : dyytdyz<d, 变 ， 见 图 14.10。 这 样 ， 通 过 目标 函数 中 

列 约束 条 件 和 归 一 化 的 联合 作用 将 保证 产生 合法 解 。 算法 过 程 如 下 : 

算法 14.2 AFACALGORITHM 
Procedure AFA; 
begin 
T-T; 


repeat 
Select a city X at random; Sum-+-0; 
for i+ 0 to n—1 do 
Encd, È Vnt Y dO, tM yi) 
rer rer 
Sum < Sum + exp(—£,,/ T) 
endfor; 
for i«-0 to 5 —1 do 
V 4; *- €Xb(— Ey, / T) / Sum 
endfor; 


-PEER Vr, ALLE tr 
until (AE — 0) 
end. . 400 
其 中 AE=0 BRAEMAR, T, ERM 30 
度 ， 均 场 退火 的 关键 是 在 某 一 关键 温度 T. £ 
附近 进行 模拟 退火 ， 以 节省 时 间 ， 得 到 较 好 
[ 100 
3 关键 温度 7 

图 4.11 是 能 量 函 数 E 随 温度 了 的 变化 

情况 ， 从 图 中 可 见 ， 在 关键 温度 T, 以 上 进 
行 退 火 对 解 没有 多 大 影响 ， 只 是 起 到 了 搜索 14.11 BRRR E 和 温度 人 的 变化 关系 
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T, 的 作用 .在 低温 时 ， 退 火 对 解 也 不 起 多 大 作用 ， 充 其 量 是 使 输出 趋向 于 0 或 1 而已， 
均 场 退火 只 是 在 关键 温度 T, 附近 有 效果 。 它 提示 我 们 : -ERA TEH To RREH 
附近 进行 退火 过 程 即 可 .下 面 介绍 一 种 T, 的 估算 方法 。 ” 

从 图 14.11 得 知 : 在 关键 温度 T, 附近 能 量 发 生 巨 变 ， 即 一 个 微小 的 扰动 将 在 整个 系 
统 中 扩散 。 可 以 通过 对 均 场 {14.3.5) 的 研究 来 考察 这 个 温度 下 的 传播 效应 ， 

设 某 城 市 了 被 第 计 1 次 访问 的 占有 概率 有 一 个 微 扰 Aryrr， 它 将 对 城市 天 被 第 让 次 
访问 的 均 场 有 如 下 影响 : 

(14.3.7) 


AE, = dyrAV yi, 
因为 在 (14.3.5) 中 只 有 第 二 项 含有 Vy,,,， 它 对 (14.3.7) ARR (AM, AL, 
=AE}). 利用 (14.3.6) 的 可 导 人 性， 可 得 均 场 变化 对 周游 路 径 上 位 置 i 的 占有 概率 作用 
是 : 
AV, 2 AE, * dV ,, / dE,, 
= (d, AV, t (exp(—Ey,/T)/ (Zexp( 一 E/I TY 


Yd 


=dyyAV pip Vnan D/T (14.3.8) 
这 里 我 们 忽略 了 AExnz 对 Vy 的 微弱 影响 。 从 (14.3.8) 式 可 知 : 城市 了 在 P1 处 的 占有 概 
率 的 增加 人 Araa>D) 将 导致 其 他 城市 在 :处 的 占有 概率 的 减少 (As<0)， 对 这 一 结论 可 
以 这 样 理解 : (14.3.8) 式 来 自 于 周游 路 径 最 短 这 一 优化 目标 项 ，AVy.m 的 增加 使 能 量 函 数 
的 第 二 项 有 所 增加 ， 欲 使 路 径 最 短 ， 必 然 某 些 东西 要 减少 ， 以 便 挤 制 周游 路 径 的 增长 ， 因 

.此 其 他 城市 的 占有 概率 自然 要 诚 小 与 此 同时 ， 我 们 不 要 忘记 对 这 一 斥 力 的 反作用 ， 即 其 
他 城市 在 i 位 置 上 形成 的 部 分 真空 将 导致 约束 条 件 不 满足 ， 它 将 在 i 处 产生 对 某 个 城市 X 
的 引力 。 从 (14.3.3) 式 中 第 一 项 可 知 ， 这 一 引力 对 无 的 均 场 作用 是 : 

aE 


a xi 
AE,- XY AV,-d,Y AV, (14.3.9) 
Zex”! oz zer 


综合 (14.3.7) 和 (14.3.9)， 可 得 总 变化 是 : 
AE, AES +AE,, 
=d, AV yt 4,34 Va 
占有 概率 的 微 扰 是 : . 
AV, AE, Vy Vy -D/T 


= {dyyAV ys, + 4, Y AV ,, WO, -D/T 


用 (14.3.8) 中 的 AV ,近似 取代 AV2,， 可 得 : 
AV = {dy td, X d, V, (V, D/T AV yy Van DAT. (14.3.10) 
zer 


每 个 城市 有 着 它 自己 的 临界 温度 了 yx， 在 这 个 温度 之 下 ， 引 力 的 作用 将 大 于 斥 力 ， 周 
游 咯 径 开 始 形成 。 这 个 温度 可 估算 如 下 : 
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AV ylror, =0 
即 

(dyy +d, Y d,,V, (V, —1)/ T,)AV 
求解 得 

ay = x 4,4, V 4,0 —Vz4)/7T, 

我 们 欲求 最 高 的 临界 温度 Tv*， 这 时 可 认为 在 高 温 下 ， 每 个 城市 对 各 位 置 的 占有 概率 
是 1/W， 代 人 上 式 得 : 


1 1 
dy = d, Y daly Xi-39/T, 


na^jVgV4-7D0/T-0 


4 Y 4,-(U —- 1Dd，4 是 平均 两 点 距离 ， 那 么 dxy = d d -RY Ty. SNIK 
时 ， 可 近似 求 得 : 

T, &d,d/4d,, (14.3.11) 
我 们 估算 出 了 每 个 城市 的 临界 温度 ， 这 样 只 要 取 T, = max (T L1 作为 整个 系统 的 临界 温 
EET. 但 为 了 更 准确 些 ， 还 需 进一步 推导 . 

EAV papa WAV, MAV pipa 施加 大 体 相同 的 作用 以 保证 自身 的 稳定 性 ， 即 AV ，， 
HAV yapa SAV pigil 2 可 得 : 


AVy 4727 (dy, +4, È dgy Va Vau D/T VY AV, V (77 T, 
zax 


Yael ZY Zi Yi+l Xi 
利用 和 从 前 同样 的 假定 ， 可 得 : 
1/ NT (d,d/ T, —d,,) 1/2 
7 应 该 在 dy 小 的 地 方 出 现 ， 当 dy ~ 0 时 ， 


2d d 
T=] R (14.3.12) 


这 样 我 们 就 可 以 在 了 ,附近 进行 模拟 退火 ， 用 数 次 热平衡 态 模拟 来 代替 整个 的 缓慢 退 
火 过 程 ， 从 而 节省 时 间 ， 得 到 较 优 解 . 


14.4 应 用 举例 


由 于 Hopficld 模型 既 具 有 丰富 的 动力 学 行为 ; 又 简单 实用 便于 VLSI 的 实现 ， 本 节 
将 以 它 为 基础 讨论 神经 计算 在 图 论 中 的 应 用 9， 用 神经 网 模型 解决 组 合 优化 问题 需 涉 及 
到 模型 选择 ， 问 题 表 示 ， 能 量 函 数 ， 运 动 方程 和 网络 参 数 等 几 个 关键 步骤 ， 在 前 面 章节 
中 ， 已 对 图 论 中 的 旅行 商 问题 作 了 详细 介绍 ， 本 节 只 采用 Hopfield 模型 来 解决 问题 ， 因 
此 我 们 将 从 问题 描述 ， 问 题 表 示 ， 能 最 函 数 、 运 动 方程 和 网 格 参数 这 几 个 方面 来 说 明 用 神 
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经 网 模型 解决 图 论 癌 题 的 基本 方法 . 值得 指出 的 是 : 问题 表示 和 能 量 函数 的 形式 并 不 是 唯 
一 的 。 我 们 所 给 出 的 只 是 一 种 较 好 的 形式 ， 如 何 设计 出 更 好 的 表达 方式 和 相应 的 能 量 函数 
是 神经 优化 计算 目前 研究 中 的 热点 。 


L 图 的 二 划分 
D 问题 的 描述 
4 G(V,E & — ^ X I I8. Vian Flom BAVA RW, 20 WED 
Hie, > 0，G 的 二 划分 是 指 将 G 的 顶点 划分 成 两 个 不 相交 的 子 集 5， AS, (SUS, 
=V,S,0S, ~ 由， 在 两 个 顶点 于 集中 所 售 顶 点 权 和 史 W (i= 1 或 2) 大 致 相等 的 情况 下 
A5, 


使 得 S， 和 5, 间 的 边 权 和 最 小 ， 即 mi 了 Ye, 


2) HERT 

可 用 神经 元 的 状态 来 表示 它 对 划分 集合 的 归属 ， 凤 六 , = 1 表示 该 神经 元 所 代表 的 顶 
点 属于 S: VV, 一 0 表示 它 属于 S,. BREE n 个 神经 元 。 
3) 能 量 函 数 

BaF ELEY, ALASE BEW, W V, V,+ YES (14.4.1) 


Heh: Vo-l1- V,. S Y, Le, 为 优化 目标 项 。 因 为 当 V = 1， 即 顶点 ies, 时 ， 


要 使 乘积 项 ,7 40, Wy, = 1， 即 y,-0. VES, 第 二 项 表示 的 是 (站 w) + 
DEA 
(Ew). Ha»0, b» 08h X a^ 5^ »2ab. BU, HENN a=b OR 


小 值 。 即 第 二 项 撒 述 的 是 当 且 仅 当 划分 后 顶点 权 和 大 致 相等 时 取 极 小 ， 所 以 能 量 函 
(14.4.1) 式 刻 划 了 图 的 二 划分 中 的 优化 问题 . 


4 运动 方程 

第 i 个 神经 元 的 运动 方程 是 : 

du, u, aE 

a ay, 
代入 (14.4.1) 式 可 得 : 

du, u, 

d -y CAEe0 72v) -2BY ww QV 70) (14.4.2) 
5 网 络 参数 

在 Hopficl4 连 续 模 型 中 ， 偏 流 72i 和 矩阵 元 索 7 ,可 由 下 式 求 出 : 


I= Constant. oif 2) 
av, 
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aE 
了 ,= Constant_of{ wav) 


其 中 Constant. of( ) 是 一 函数 ， 从 它 可 得 到 多 项 式 的 常数 项 . 这样， 对 二 划分 问题 来 
说 ， 


I,— Ae, -2Bw,Yw, (14.4.3) 
7 1 
T,,= —24e, t 4Bw,w, (14.4.4) 
2. 图 的 K 划 分 
1) 问题 的 描述 


图 GLV,E) 的 划分 是 指 将 G 的 顶点 划分 成 个 彼此 不 相交 的 子 集 5,， 即 5 


=y, SoS 一 了 ,i 沽 jij=1,… 尼 ， 在 保持 各 划分 内 顶点 权 和 大 至 相等 的 情况 下 ， 使 得 
任意 两 划分 问 的 边 权 和 尽 可 能 的 小 。 
2) 问题 表示 

对 于 图 的 K(K > 2) 划分 亲 题 ， 就 不 能 简单 地 用 神经 元 的 最 终 二 值 状态 来 表示 了 ， 最 
好 用 局 换 短 阵 表示 。 短 阵 的 行 代表 顶点 ， 列 代表 所 属 的 划分 集合 ， 神 经 元 (i, J) 的 输出 
VY ,一 1 则 表示 图 的 第 1 个 项 点 应 属于 第 /个 划分 ， 总 共 需 要 x 下 个 神经 元 ， 
D ERER 


AEE . Bled 2 EE: 
r4 riiv 3(iir-:) ur 


* 2 XXX. Va x (14.4.5) 
tae 
凹 中 的 第 四 项 是 优化 目标 项 ， 它 最 小 化 各 划分 闻 的 边 权 和 ， 第 一 项 是 行 约束 ， 表 示 每 个 顶 
点 最 多 属于 一 个 划分 集合 。 第 二 项 是 全 局 约束 ， 它 要 求 有 nt 个 1 使 得 全 部 顶点 被 划分 . 


第 三 项 表示 : e ww,)”。 它 同样 利用 算术 平均 和 几何 平均 的 关系 表示 了 各 划分 内 顶点 
—Ó€—— 
4) 运动 方程 

-4 $ ZELLE EA 

-DÈ $ e,r x (14.4.6) 


它 表示 第 (,X) 个 神经 元 的 运动 方程 ， 为 不 混淆 起 见 ， 我 们 对 部 分 项 进行 了 下 标 符 换 。 


5 网 络 参数 
Ix= Ba (14.4.7) 


Tipp = — 46, py) B Cw,w dy De (1-5, ) (14.48) 
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这 里 简单 介绍 一 下 网 络 参数 中 5 函数 是 如 何 得 出 的 ， 从 (144.6) RRNA, =E, 


E 
中 可 知 (为 讨论 方便 ， 下 标 进 行 了 蔡 换 ) ， > MY i= j/MZ#X HAR (BT #0), 
m 


因此 网 络 参数 中 含有 5,(1 -5vy )， 即 从 直观 上 看 ， 如 果 求 和 中 有 次 关 了 这 一 条 件 ， 那 么 
连接 矩阵 中 必 有 (1 一 5。y) 这 一 项 . 


3 围 的 项 点 覆盖 
D 问题 描述 

图 G(V,E) 的 顶点 覆盖 是 G 的 一 个 子 集 S CV, REG 的 每 条 边 至 少 有 一 个 顶点 
YES, 中 . 图 的 顶点 覆盖 问题 则 在 找 出 具有 最 少 元 素 个 数 的 8，. 
2) 问题 表示 

与 图 的 二 划分 问题 类 似 ， 可 用 神经 元 的 二 值 输出 状态 表示 该 神经 元 的 归属 。 当 网 络 
稳定 时 ， 凡 是 v, = 1 ARR RS TV, ~ 0 的 那些 项 点 则 不 属于 最 小 覆盖 
集 ， 整 个 问题 可 用 = 个 神经 元 表示 . 


3) 能 量 函 数 
BEG BRIER = (0), AER. M 
ERTDLVY + FLEW, (14.4.9) 


JUbV,-1— V, BULL. CRD), SUE. 368—308 


AHH, REV, RY, 中 的 一 个 属于 S,. AON, 或 到 为 0， 该 项 取 最 小 值 
人 运动 方程 


Si LË py, e BYa a-r) (14.4.10) 
t 1 Td rai i 
5 网 络 参数 
I= BYa, (14.4.11) 
T, = —A— Ba (14.4.12) 


DOME d RI CUI UR BUR ABC ANTE, BATERKA 
WI. SRNR T, 


4. 图 的 独立 集 
D 问题 描述 ” 
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图 GC, E) 的 独立 集 是 G 的 一 个 顶点 子 集 8，= V， 在 此 子 集中 ， 任 意 两 顶点 间 均 无 
边 相 连 。 图 的 极 大 独立 集 问 题 就 是 要 找 出 极 大 的 S, 来。 
2 问题 表示 

对 于 个 顶点 的 图 G 需 使 用 n 个 神经 元 .网 络 稳定 时 ，V ,1 所 表示 的 顶点 
eS,; V,=0 MFR BE HS... 
3) 能 最 函数 

假定 图 G 用 邻接 矩阵 4 — (0,), AR, W 


if axa 
Bm -SEEN Yay, (144.13) 
与 上 而 的 能 量 画 教 (14.4.9) 相 比 ， 优 化 项 差 了 一 个 符号 ， 这 是 因为 (14.4.13) 所 要 求 的 是 最 
XH. SR (14.4.9) 和 (14.4.13) 所 表示 的 约束 条 件 是 互 斥 的 ， 式 (14.4.13) 的 约束 条 件 表 
W: 如 果 有 边 (i, Pek, a =1. RAV, 或 ssS， 即 一 0 或 局 一 0 时 ， 约 束 条 件 
最 小 


有 ”运动 方程 
di 
= = Can + ALL BYa,, (14.4.14) 
5 网 络 参数 
1,-0 (14.4.15) 
T,-4-—Ba, (14.4.16) 


这 里 偏 流 项 为 0， 表 示 该 网 络 不 需要 仿 流 ,， 


5. 图 的 最 大 集团 
1) 问题 描述 
图 GOE) 的 集团 是 G 的 一 个 顶点 子 集 5, SV， 在 此 子 集中 ， 每 两 个 互 异 的 顶点 间 
均 有 边关 联 .图 的 最 大 集团 问题 旨 在 找 出 使 5， 中 元 素 尽 可 能 多 的 一 个 子 集 、 
”问题 表示 
令 6. 是 图 6 的 补 图 (G, 之 顶点 与 G 相同 ，G, 之 边 在 G 中 不 出 现 ) 。 如果 S, 
是 G 之 集团 ， 则 5S, 2G, 的 独立 集 . 假定 G 的 邻接 矩阵 为 : 4 = (a), 则 其 补 图 的 
邻 楼 矩阵 4。 (1 一 a,), ,这样 一 来 ， 为 了 求 最 大 集团 ， 就 可 用 上 而 的 求 极 大 独立 集 
的 方法 ， 只 是 将 a BORO 一 a) 就 行 ， 由 此 可 见 ， 为 了 更 好 地 把 某 一 问题 映射 到 神经 网 
模型 中 ， 原 问题 的 适当 表示 { 如 (av ) ,sw,G, ) 也 是 非常 重要 的 ， 这 点 在 下 而 讨论 图 的 平面 
化 问题 中 尤其 重要 ， ‘ 
3) Rem 


A Bove 
Bm -ZEEV XY, (14.4.17) 
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Joa, -1—a,, BHAA, RoR, BUR V = v ed. EM 
都 属于 3,， 那 么 一 定 有 边 相连 使 a, ~ 1， 这 时 a, = 0 取 最 小 值 。 


4) 运动 方程 
du u _ 
T” -7 tAEY,-BLa,V, (14.4.18) 
5 网 络 参数 
T=0 (14.4.19) 
T,-4-Bà, (14.4.20) 
6. 图 的 最 大 匹配 
1) 问题 描述 


G(V,E) 的 一 个 匹配 是 G 的 一 个 边 子 集 M < 已 ， 在 此 边 集 中 任 两 条 边 不 会 共享 同 
一 个 顶点， 图 的 最 大 匹配 问题 是 指 找 出 这 种 最 大 的 边 集 。 
2) 问题 表示 

由 于 这 里 是 以 边 为 主考 虑 问题 ， 故 对 于 m 条 边 的 图 需要 m 个 神经 元 ， 网 络 稳定 时 ， 
神经 元 i 的 输出 .V = 1 表示 第 i 条 边 是 匹配 边 . 
3) ERAK 

假定 图 G(V,E) 用 关联 矩阵 表示 《n 为 顶点 数 ，m 为 边 数 】 、 

"P -(* DUR ! 与 边 7 相关 联 

ij axm 0, HE 

E= -AEV +F ETE bab, (14.4.21) 
其 中 : 第 一 项 为 优化 项 ， 与 上 面 的 优化 项 相 比 ， 这 里 采用 了 一 次 函数 。 虽 然 它们 的 功能 
相同 ， 但 一 次 项 系数 不 在 7, 中 出 现 ， 便 于 VLSI 的 突现 . 第 二 项 是 约束 项 ， 它 表示 当 
边 ;和 边 JAAR RM, V, Ry 至 少 有 一 个 不 在 匹配 集中 ， 即 v, - 0. 
4) 运动 方程 

du, u, TI 

d 77.4 -#22 V baby, (14.422) 
5 网 络 参数 

I,=A (14.423) 


T=- D uba (14.4.24) 
7， 图 的 同 构 


1) 问题 描述 
图 G(V,E) 5j GUV EN 是 同 构 的 ， 当 且 仅 当 存 在 着 一 一 映射 函数 Pv V^ BR. 
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V V,eY, Vy.eV', KV) Vy. AWRY V eE WV, V,)eE, HPS) 
=V; 
2) 问题 表示 

图 的 同 构 问题 也 可 用 ”xz RE. MAREN, FALH Vy 
= 1， 则 表示 G 的 顶点 V, 映射 到 C 的 顶点 V E. 如 果 在 一 定 的 时 间 内 网 络 不 稳定 或 
得 到 的 是 不 满足 约束 条 件 的 非法 解 ， 则 说 明 G 与 G^ 同 构 的 可 能 性 不 大 。 
3) 能量 函数 


A B c 
E=-5 E2 E VaV tZ EEE yh aty LV.-m 
1 ter "ea 7 


D 
tz ELEY byy V iY y (14425) 
TETT 


其 中 (ea ey AO py) nan 分 别 是 图 G 和 G 的 邻接 矩阵 。 式 (14.4.25) 中 的 前 三 项 与 TSP 
中 的 约束 项 类 似 , 表示 一 个 置换 矩阵 .第 四 项 是 优化 目标 项 , 它 表示 
MASOVIAN» FV) =V, 时， 存在 着 边 (i,j)eE 和 (X,Y 了 )eE'， 使 得 表达 式 


lay- byr!" VV, 为 零 取得 最 小 值 . 
4) 运动 方程 
du uy, 
qoute AL Yu BEV ~ CLE N m 


yer 


-DYYla,-b,l*V, (144.26) 
5 网 络 参数 

Ip =EN (14.4.27) 

Tag = 49,0 —79,)  B6,,0—8,) -C- Dla, b pyl (14.4.28) 
8. BHEE 
1 问题 描述 ” 

图 G(V, E) 的 顶点 着 色 系 指 图 中 有 边 相 连 的 顶点 应 着 不 同 的 颜色 ， 图 的 着 色 问 题 间 在 
找 出 最 少 的 颜色 数目 ,假定 顶点, 的 度 为 d,， 可 定义 图 的 度 为 4 
= max(d, W,evi. 第 12 章 已 经 证 明了 最 多 只 需 人 一 4 + 1 种 颜色 即 可 对 G 进行 着 


fa, 
2) 问题 表示 

这 里 只 能 对 着 色 问题 进行 验证 ， 即 检查 是 否 可 用 久 种 颜色 对 图 G 进行 着 色 . 同样 
用 nx 下 的 置换 矩阵 表示 ， 不 过 它 只 有 行 约束 ， 即 一 个 顶点 只 能 着 一 种 颜色 。 网 络 稳 定 
时 ， 位 于 (i，X) 神经 元 的 输出 ,= 1， 表 示 顶 点 i 应 着 第 XX 种 颜色 ， 
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3) 能 量 函 数 
假定 图 C 用 邻接 矩阵 4 = (a) 


lawn 


表示 ， 则 


“$I Ee (Ey, -») * cXiYew, Y. (14429) 
其 中 前 两 项 是 约束 条件， 第 三 项 是 优化 目标 项 ， 表 达 式 airY V 表示 当 有 边 (i, j)e E 
时 (ay £0), Dus LATBUS 7 不 能 着 相同 的 颜色 X. WY, RV, 为 零 ， 使 得 整个 式 子 为 
零 取 最 小 值 - 
4) 运动 方程 
du, us x ae ` 
ET - —R-4X vu c EEren -CYayW, (14.4.30 
5 网 络 参数 
I, —Bn (14.4.31) 
— 49,0 —0,,)—B— Ca, B, (0 —6,) (14.4.32) 


u^ xY ii 


aur 


9. 图 的 搜索 
D 问题 描述 

这 里 以 8 皇后 问题 为 例 说 明神 经 网 模型 在 图 的 搜索 中 的 应 用 .国际 象棋 中 皇后 威力 无 
比 、 和 熔 制 纵 、 横 、 斜 四 条 直线 。 八 皇后 问题 就 是 在 8 x 8 的 棋盘 上 布 8 个 皇后 ， 使 得 任意 
横 线 、 纵 线 、 斜 对 角 线 上 只 有 一 个 皇后 ， 
2) 问题 表示 

8 皇后 问题 也 可 用 8 x 8 的 置换 矩阵 表示 。 网络 稳定 时 ， 位 于 {i, 7) 神经 元 的 输出 V. 
一 1 表示 该 位 置 可 放 一 个 皇后 . 


3) ERSA 
en=4yyy7,v, +200, +SEE X6 VV 
ay, T 2T SOE 2G pax ra wn omo 
POLY, 8 (14.4.33) 


1& (8 — HE (036 58 — DUROS WI AE RUNE AS LETTRE. DDR EL DON |i- JO 1X — YI 
时 ，(i,X) 和 GLY) 位 于 和 斜 对 角 线 上 ， 这 个 能 景 函 数 没有 优化 自 标 项 ， 但 约束 条 件 项 还 是 相 
当 复杂 的 ， i 


4) 运动 方程 
Quy 一 xx 
dt 4 PL ~ BEV ~ cx ES nV aA» Vy -8 
(14.4.34) 
5 网 络 参数 
Tr=8D (14.4.35) 


Tam — Aóifl1-à,,) - B5,,(01-8,) -C(1—8,)0 —6yr YO, ax-n -D 


(14.4.36) 


10. 图 的 平面 性 测试 
D) 问题 描述 
设 有 如 图 14.12(a) 所 示 的 图 ， 可 重 排 其 中 各 边 的 位 置 (如 图 14.12(b) 所 示 )， 使 得 


Y. y. 
Y. Va v Y. 
2 


(a) 


(b) 


图 14.12 可 平面 化 图 


Vs 


Vi 
V; 

Vs Vi 

{a) 

图 14.13 不 可 平面 化 图 

各 边 不 相交 . 但 对 于 图 14.13(a) 所 示 的 图 ， 元 论 如 何 改 变 边 的 位 置 ， 都 不 能 使 它们 互 不 相交 ， 
即 该 图 的 边 无 法 平面 化 ， 于 是 问题 为 : 给 定 一 个 平面 图 G(V, 辐 ， 能 否 找 到 一 种 边 的 连 法 ， 使 
它们 互 不 相交 ? 如 失 不 能 ， 最 少 除去 几 条 边 得 到 E c E (iof GXV, 忆 ) 能 够 平面 化 . 
D) 问题 表示 

上 面 描述 的 问题 与 下 述 问 题 是 等 价 的 ， 即 :将 给 定 图 的 顶点 排 成 一 直线 ， 如 通过 顶点 
间 的 上 连接 或 下 连接 可 将 图 平面 化 ， 则 原 图 也 是 可 以 平面 化 的 ， 如 图 14.14 Bras. 因此 ， 


vi Yi 
X< ^ ^ i 
Y. v, 

(a) 


o 


图 14.14 图 的 直线 上 下 连 法 
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Wf JB SB RES TE SR Be RET, HA 14.14 中 有 条 上 连 边 (i, NA 
ERARV, ( > 门 与 之 对 应 ; 同 理 下 连 边 (i, 站 有 下 三 角 元 案 V, (> IMM. 图 14.14(b) 
的 矩阵 表示 如 下 : 


T 


o|-|e- 


1 
1 
0 
0 


alojolo 
-|elel- 


图 14.14b) 中 有 上 连 边 V, V», WEEER hib AP Va RE Vau 1. 
3) 能 量 函 数 
设 图 的 邻接 矩阵 是 (2 ，) 


ij’ nxa 
=EL, + Vya +I DEEL DM m (144.37) 
这 两 项 都 是 约束 项 ， 第 一 项 表示 如 果 顶 点 i 与 顶点 ZAR, = 1)， 则 应 有 上 连接 
或 下 连接 :但 只 能 是 一 种 ， 否 则 平方 项 不 为 零 。 第 二 项 表示 边 与 边 之 间 不 应 有 交 丸 .。 因 
HK FU, m, i, ) EXAT: 
0) 如果 VG « JV, m) 都 是 上 三 角 元 素 , Yi<icm<jRi<l<jcm 
时 ， 有 交叉 边 ， 这 时 fU, m, i, D) 79 ! ARREST, dne 14.15(a) 和 14.1500) 所 示 。 
(2) WR Vii» j) V_li>m)E FEAR, Ym jcl<iM jem«i«cli], A 
RM. WS f (imi d= 1 ARE SOPH 14.15(c) 和 14.15(d) 所 示 、 
(3) HABA RAWAEM, f(Lm,L3-0. 


， 则 


4 ”运动 方程 
du, uy ^] gy 
TT CAU Ay) -5YY fü, m.i, D) V, (14.4.38) 
5 网 络 参数 
LET (14.4.39) 
Taw =T AGS yy + 8,9,) BSU, m, i, D (14.4.40) 


上 i m P i t i "m 
a) (b) 

m i D i i m i D 
€ @ 


图 14.15 边 交叉 情况 
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14.5 小 E 


本 章 我 们 介绍 了 神经 计算 及 其 应 用 ， 着 重 介绍 了 神经 网 络 在 图 论 中 的 应 用 ， 第 一 节 曾 
述 了 神经 网 络 的 基本 原理 和 特征 ; 第 二 节 以 Hopfield 模型 为 例 讨论 了 神经 计算 的 机 制 ; 
第 三 节 以 旅行 商 癌 题 为 线索 ， 简 单 介 绍 了 其 它 几 种 有 影响 的 神经 网 络 模型 ， 最 后 给 出 了 怎 
样 用 Hopfield 模型 求解 10 个 典型 的 、 难 的 图 论 问题 . 


参考 文献 


[1] Anderson J, Rosenfeld E. Neurocomputing, MIT Press, 1988 
[2] Brandt R aL et. Alternative Networks for Solving the Traveling Salesman Problem and List Matching 
Problem, Proc. IEEE Int. Conf Neural Network 11:333—340, 1988 
B} Burr D. In Improved Elastic Net Method for the Traveling Salesman Problem, Proc. IEEE Int. Conf. 
Neural Network Y: 69-76, 1988 
[4] Durbin R, Willshaw D. An Analogue Approach to the Traveling Salesman Problem Using an Elastic 
Net Method, Nature 326: 689-691, 1987 
[5] For J C. Solving a Combinatorial Problem via Self-Organizing Process: An Application of the 
Kohenen Algorithm to the Traveling Salesman Problem, Biol Cybern 59:33—40, 1988 
[6] Grossberg 8. Neural Networks and Neural Intelligence. MIT Press, 1988 
[7] Hopfield J J. Neural Networks and Physical Systems with Emergent Collective Computational Abili- 
ties, Proc. Natl. Acad. Sci, USA, Vol 79,2554—2558, 1982 
[8] Hopfield J J. Neurons with Graded Response Have Collective Computational Properties like those of 
two-state neuron, Proc. Natl. Acad. Sci., USA, Vol 81, 3088—3092, 1984 
B] Hopfield J J, Tank D. Neural Computations of Decisions in Optimization Problems, Biol 
Cybern 52 :141-152, 1985 
[10] Kirkpatrick S, al. er. Optimization by Simulated Annealing, Science 220 :671—680, 1983 
[11] Kohonen T. Self-Organization and Associate Memory, Springer Berling, 1984 
[12] Lippmann R P. An Introduction to Computing with Neural Nets, IEEE ASSP, 4-22, April, 1987 
113] Rumelhart D E, McClelland J L. Parallel Distributed Processing, Vol.1—2, MIT Press, 1986 
[14] Ramanujam J, Sadayappan P. Optimization by Neural Networks, Proc. IEEE Int. Conf Neural Net- 
work Il: 325—332, 1988 
[15] Szu H. Fast TSP Algorithm Based on Binary Neuron Output and Analog Input Using the 
Zero-diagnoal Interconnect Matrix and Necessary and Sufficient Constraints of the Permutation 
Matrix, Proc. IEEE Int. Conf. Neural Network YI: 259—266, 1988 
[16) Takefuji Y, Lee K C. A Near-Optimum Parallel Planarization Algorithm, Science, Sep. 1989 
—307— 


[17] Tang X-N, et al. Equivalent Class Energy Function for Solving the TSP, Proc. Inter. Conf for 
Young Computer Scientists, Beijing, July 1991 

[18] Van den Bout DE. Improving the Performance of the Hopfield-Tank Neural Network Through 
Normalization and Annealing, Biol Cybern 62:129—139, 1989 

[19] Wacholder E, et al. A Neural Network Algorithm for the Multiple Traveling Salesmen Problem, Bio! 
Cybern 61: 1119, 1989 

[20] Wilson G, Pawley G. On the Stability of the Traveling Salesman Algorithm of the Hopfield and 
Tank, Biol Cebern 58: 63-70, 1988 

Qi] 中 国良 ， 神 经 网 络 用 于 求解 组 合 优化 问题 ，C2MN2-90 中 国 神经 网 络 首届 学 术 大 会 论文 集 ， 中 国 ， dE 
HK, 122-129, 1990 

[22] 焦 李 成 ， 神 经 网 络 系统 理论 ， 西 安 电子 科技 大 学 出 版 社 ，1990 


一 308 一 


算法 2.1 
算法 2.2 
算法 3.1 
算法 3.2 
算法 3.3 
算法 3.4 
算法 3.5 
算法 4.1 


算法 4.2 
算法 43 


算法 4.4 
算法 4.5 
算法 4.6 
算法 5.1 
算法 5.2 
算法 5.3 
算法 5.4 
算法 5.5 
算法 5.6 
算法 5.7 
算法 5.8 
算法 6.1 


算法 6.2 


算法 索引 


LIST RANKING PROBLEM( 表 计数 问题 ) 
MAXIMAL INDEPENDENT SETPROBLEM( 极 大 独立 集 问 题 ) 
PURE TRAVERSAL SEARCHING( 纯 遍历 搜索 (分 布 式 ))* 
DISTRIBUTED DFS( 分 布 式 深度 优先 搜索 ) n 
IMPROVED DISTRIBUTED DFS( 改 进 的 分 布 式 深度 优先 搜索 ) 
DISTRIBUTED BEFS( 分 布 式 宽度 优先 搜索 ) veerereerreneer cernens 
IMPROVED DISTRIBUTED BFS( 改 进 的 分 布 式 宽度 优先 搜索 ) - 
CONNECTED-COMPONENTS USING TRANSITIVE -CLOSURE 
(传递 闭 包 法 求 连通 分 支 ) 
MINIMUM OF n ELEMENTS( 求 n 个 元 素 的 最 小 值 )… 
CONNECTED-COMPONENTS USING COLLAPSE VERTICES 


(顶点 倒塌 法 求 连通 分 支 ) nnnm nenne nennen ten ennt nn netten nn tne natn se seat (46) 
OPTIMAL CONNECTED-COMPONENTS ALGORITHM 

[Carn ETA) LILIA) REESE ERES (51) 
CONNECTED-COMPONENTS ON LINEAR ARRAY 
(线性 阵列 上 求 连通 分 支 ) onore enne eren nene eene nenne enne nennen ennt (55) 
CONNECTED-COMPONENTS ON MESH ARRAY 

CC AMEPITL. OR FETE) enne eene erre rennen nene ener nennen nennen (58) 
PARALLELIZATION OF SOLLIN'S ALGORITHM 

(SOLLIN J& 3 B 33M) eee ennn nennen unen unen entn nine enean rente rennen nena (64) 


MINIMUM SPANNING TREE ON TREE MACHINE 
{ 树 机 上 求 最 小 生成 树 )… 
MST ON MESH ARRAY( 二 维 网 也 上 求 最 小 生成 树 ) 
ANCESTORS IN INVERTED TREE( 逆 树 中 求 顶点 的 所 有 祖先 ) - 
UPDATING MST BY ADDING A NEW VERTEX 

{ 项 点 更 新 的 最 小 生成 树 算法 ) e nennen nnne nnne nennen nenne rns ntn ente tnen unen (74) 
UPDATING MST BY CHANGING EDGE’S WEIGHT 

( 边 权 值 更 新 的 最 小 生成 树 算 法 ) 
SOLLIN’S ALGORITHM (SISD){ 申 行 的 SOLLIN 算法 求 MST) - 
MST DISTRIBUTED ALGORITHM( 最 小 生成 树 的 分 布 式 算法 ) - 
DIJKSTRA ALGORITHM (SISD) 

( 单 源 最 短路 径 问 题 的 DOUKSTRA 算法 ) 
BROADCAST( 并 行 实现 DIJKSTRA 算法 中 的 数据 广播 ) - 


算法 6.3 


算法 6.4 


算法 6.5 


算法 6.6 


算法 6.7 


算法 6.8 


算法 6.9 


算法 7.1 
算法 7.2 


算法 7.3 


算法 7.4 


算法 7.5 
算法 7.6 


算法 8.1 


算法 8.2 


算法 8.3 
算法 8.4 


算法 8.5 


算法 8.6 


算法 8.7 


一 310 一 


FLOYD ALGORITHM (SISD) 
(所 有 顶点 对 的 最 短路 径 问题 的 FLOYD 算法 ) …… 
ALL VERTICES SHORTEST PATH ALGORITHM 


{ 所 有 顶点 对 的 最 短路 径 并 行 算法 ) nnne eene eene emen (90) 
TRANSITIVE CLOSURE ON SYSTOLIC ARRAY 

(全 维 心动 网 孔 上 用 传递 闭 包 法 求 最 短路 径 ) 3m————— (91) 
MOORE ALGORITHM (SISD) 

{ 单 源 最 短路 径 问 题 的 MOORE EIA ) nennen enne nennen nenne (93) 
PARELLEL ALGORITHM FOR SHORTEST PATH 

(在 MIIMD 模型 上 求 单 源 最 短路 径 问 题 的 并 行 算法 ) eM m— (95) 
EXAMIZATION TO ELEMENTS 

(在 链接 数组 中 进程 检查 移 去 元 素 算法 ) eene nennen (97) 
A DISTRIBUTED ALGORITHM FOR SINGLE SHORTEST PATH 

( 单 源 最 短路 径 癌 题 的 分 布 式 算法 ) - 


PARALLEL MATRIX MULTIPLICATION( 并 行 矩阵 乘法 ) 
MATRIX MULTIPLICATION ON MESH ARRAY 

{ 二 维 网 孔 上 的 矩阵 乘法 ee (108) 
MATRIX MULTIPLICATION ON HYPERCUBE 

{ 超 立 方 上 的 矩阵 莱 法 ) 
MATRIX MULTIPLICATION ON SHUFFLE-EXCHANGE 
{ 洗 牌 网 络 上 的 矩阵 乘法 ) e 
MATRIX MULTIPLICATION (SISD) (fT HAE RESTE ) 
MATRIX MULTIPLICATION ON MIMD MACHINE 
(MIMD $128 E RUIAEESEIE ) ee (115) 
FINDING FUNDAMENTAL CYCLES OF GRAPHS 

( 找 图 的 基本 回路 ) -- 
PREORDER TRAVERSAL OF INVERTED TREE 

(计算 道 树 的 先 序 标号 算法 ) ennnnnnere rte enn nnne enne nnn enne nennen enne enn (126) 
BICONNECTIVITY ALGORITHM( 找 图 的 双 连 通 分 支 算法 ) n (128) 
BICONNECTIVITY ALGORITHM BY EULER TRAVERSAL 

《用 殉 拉 遍历 求 双 连 通 分 支 算法 ) 
CONSTRUCTING LIST OF TREE 
(构造 生成 树 的 邻接 表 (算法 8.4 使 用 ) ) oe 
COMPUTING GLOBAL LOW 

(计算 全 局 最 小 标号 顶点 (算法 8.4 使 用 ) ) nnnm (135) 
COMPUTING LOCAL LOW 

(计算 局 部 最 小 标号 顶点 (算法 8.6 使 用 ) ) (136) 


算法 8.8 
JO 8.9 


算法 9.1 
算法 9.2 


算法 9.3 

算法 10.1 
算法 10.2 
算法 103 
算法 10.4 


算法 10.5 
算法 10.6 
算法 10.7 
算法 10.8 


算法 10.9 

算法 10.10 
算法 10.11 
算法 10.12 
算法 10.13 
算法 10.14 
算法 10.15 
算法 10.16 


算法 10.17 
算法 10.18 
算法 10.19 
算法 10.20 
算法 10.21 


算法 11.1 
算法 11.2 


BRIDGES ALGORITHM( 计算 无 向 图 的 桥 算法 ) coveesassesssssssssssassons (139) 
BRIDGES ALGORITHM ON MESH ARRAY 

{二 维 网 孔 上 求 桥 算法 ) -… 
FINDING DIRECTED EUER CYCLES( 找 有 向 欧 拉 回路 ) 
FINDING HAMILTON PATH IN TOURNAMENT 

{ 求 竞赛 图 的 哈密 顿 路 径 ) 
HAMILTON PATH ALGORITHM( 找 哈密 顿 回路 算法 ) 
TEST ALGORITHM ( 测试 有 向 图 的 有 向 回路 算法 ) 
TOPOLOGICAL SORTING( 拓扑 排序 算法 ) ereere 
FINDING MAXIMUM WEIGHTED PATHI( 找 最 大 加 权 了 路径 )… 
FINDING CRITICAL PATH ON AOE NETWORKS 


(BR AOE 网 的 关键 路 径 -ee ———— (169) 
FINDING TOPOLOGICAL ORDERS ON NETWORKS 

(EEM LMI ) nnne enne nnne nennen 71) 
FINDING CRITICAL PATH ON NETWORKS 
(互连网 络 上 的 关键 路 径 算法 m (173) 
CRITICAL PATH ALGORITHM AT FIRST STAGE 

《 求 关键 路 径 分 布 式 算法 的 计算 最 早 开始 时 间 阶 段 ) nennen (174) 


CRITICAL PATH ALGORITHM AT SECOND STAGE 

{ 求 关键 路 径 分 布 式 算法 的 计算 最 迟 开始 时 间 和 松 驰 时 间 阶 段 )… 
PUSH OPERATION( 流量 向 前 推进 的 PUSH 操作 ) «M 
RETURN OPERATION( 流量 向 后 返回 的 RETURN 操作 ) 
FINDING MAX-FLOW ALGORITHM( 找 最 大 流 算法 ) 
CLEAR ON PS~TREE (PS- 树 上 的 置 0 操作 ) +++ 
UPDATING ON PS-TREE (PS- 树 上 的 修改 操作 ) 
SUMMING ON PS-TREE (PS~ 树 上 的 求 和 操作 ) 


FINDING ON PS-TREE (PS- 树 上 的 查询 ) 

INITIALIZATION OF MAX—FLOW PROBLEM 

(最 大 流 问 题 的 初始 化 ) enne eee (183) 
PUSH-OPERATION IMPLEMENT (PUSH 操作 的 详细 实现 )……-……… (184) 


RETURN OPEATION IMPLEMENT (RETURN 操作 的 详细 实现 ) … (185) 
CLEAN OPERATION( 清除 操作 ) … - (186) 
SIMULATING ON SIMD MACHINE( 在 SIMD 机 器 上 模拟 ) s+ (188) 
FINDING MAX-FLOW USING DFS TECHNIQUE 

《运用 深度 优先 搜索 技术 找 最 大 流 的 分 布 式 算法 ) 
FINDING MIS (SISD)( 找 极 大 独立 集 的 串 行 算 法 )… 
FINDING MIS IN PARALLEL( 并 行 找 极 大 独立 集 ) … 


^ (191) 
(197) 
~ (198) 


一 311 一 


算法 113 


算法 11.4 


算法 115 


算法 11.6 


算法 11.7 
算法 11.8 


SIMPLE RANDOMIZED PARALLEL ALGORITHM FOR MIS 


{ 找 极 大 独立 集 简单 的 随机 并 行 算法 -eo (199) 
COMPLEXED RANDOMIZED MIS ALGORITHM 
( 找 极 大 独立 集 复杂 的 随机 并 行 算法 ) MM HI (200) 
IMPROVED RANDOMIZED MIS ALGORITHM 

^ 《改进 的 极 大 独立 集 随 机 并 行 算 法 ) eurer nnne ener nennen nennen (206) 
DETERMINITIC PARALLEL ALGORITHM FOR MIS PROBLEM 
( 极 大 独立 集 问 题 的 确定 性 并 行 算法 ) nnne nee (208) 
MIS ALGORITHM BY KARP( 极 大 独立 集 算法 的 KARP 框架 结构 (211) 
FINDING A VERTICES SET( 算 法 11.7 调用 的 函数 FINDSET ) ~=- (212) 
BUILDING A GRAPH( 算法 11.8 WAH BASE BUILD ) «HM (213) 


算法 11.9 
算法 11.10 


算法 11.11 


算法 11.12 
算法 12.1 


算法 12.2 


算法 12.3 
算法 12.4 


算法 12.5 
算法 12.6 
算法 12.7 
算法 12.8 
算法 12.9 


算法 12.10 


算法 12.11 
算法 13.1 


算法 13.2 


—312— 


FINDING A MAXIMAL CARDITICAL MATCHING 


(算法 11.8 调用 的 函数 MATCH) … 
BROADCASTINGINA LINKED LIST 
(算法 11.12 调用 的 过 程 BROADCAST - 


REDUCING IN A GRAPH 人 算法 11.8 调用 的 函数 REDUCE ) (217) 
VERTEX-COLORING OF GRAPHS WITH CONSTANT DEGREE 
{常数 度 图 的 顶点 着 色 PERLES (222) 
MIS OF GRAPH WITH CONSTANT DEGREE 

CREE BKM ) 


COLOR-A-I-GRAPH WITH A-DEGREE( A 度 图 的 A+1 着 色 ) 


VERTEX COLORING OF PLANAR GRAPHS WITH 7-COLORS 

IG d TRGB) rereerereruerneesuuueseseeuuunnoeosusonsosorenennesísusnnnne (226) 
VERTEX COLORING OF PLANAR GRAPHS WITH 5-COLORS 
(平面 图 顶点 的 5 着色》 nmm ——— (227) 
THE OPTIMAL ALGORITHM OF PLANAR GRAPH'S 
FIVE-COLORING( 平 面 图 5- 着 色 的 最 优 算法 ) enne nennt (234) 


EDGE COLORING OF TREES( 树 的 边 着 色 ) 
EDGE-COLORING 2-WAY GRAPHS( 二 路 图 的 边 着 色 ) -- 
EDGE-COLORING d-WAY BIPARTITE GRAPHS 


(4- 路 二 分 图 的 边 着 色 enne nennen e eene ee enne eo sen nennen etate snnt nen nnne nnn (239) 
EDGE-COLORING OF BIPARTITE GRAPHS WITH DEGREE d 
(d 度 二 分 图 的 边 着 色 ) enneen enn nennen ntnntan na ——— 


EDGE-COLORING OF MULTIGRAPHS( 多 重 图 的 边 着 色 ) - 
PARALLEL DIVIDE-AND-CONQUER ALGORITHM 

(并 行 分 治 算法 )… 
BRANCH-AND-BOUND ALGORITHM( 分 枝 限 界 算法 ) 


算法 13.3 


算法 13.4 


算法 13.5 
算法 13.6 
算法 13.7 
算法 13.8 
算法 13.9 
算法 14.1 
算法 14.2 


TRAVELING SALESPERSON ALGORITHM (SISD) 

( 串 行 的 旅行 商 算法 J ene /——————— (257) 
TRAVELING SALESPERSON ALGORITHM (TIGHTLY COUPLED 
MULTIPROCESSORJ( 紧 耦合 多 处 理 器 上 的 旅行 商 算法 )…… - 
ALPHA-BETA ALGORITHM (SISDY «81785 a-p 算法 ) - 
UPDATE «-f WINDOW ALGORITHM( 修改 a-8 窗口 算法 )… 
TREE-SPLITTING ALGORITHM( 并 行 树 分 裂 算 法 ) enn - (266) 
PARALLEL PV-SPLITTING ALGORITHM( 并 行 PV- 分 裂 算 法 ) = (268) 
UIDPABS ALGORITHM( 异步 选 代 深 化 并 行 -8 搜索 算法 ) - (269) 
SA-ALGORITHM( 模拟 退火 算法 ) -… … (292) 
AFA-ALGORITHM ( 均 场 退火 算法 ) ~ 


—313— 


